Salmon (1) est une application de quantification qui ne demande pas l'alignement préalable des séquences FASTQ sur un génome de référence. À partir d'un index des séquences contenu dans un transcriptome de référence, Salmon en mode mapping procède à un alignement et crée un table de l'abondance de chaque transcrit représenté dans les fichiers FASTQ paired-end.
Note importante: Salmon ne fait pas la découverte de nouveau transcrits pas plus qu'il ne peut trouver de nouveaux exons. Il trouvera uniquement les séquences qui sont représentées dans le transcriptome de référence.
% cd && mkdir monAnalyse
% mkdir salmonIndexes % cd salmonIndexes % curl -L -O ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_32/gencode.v32.transcripts.fa.gz % unzip gencode.v32.transcripts.fa.gz
salmon
en mode index afin de créer l'index de recherche que salmon
utilisera pour sa recherche de transcrits.~/salmonIndexes
et que salmon
se trouve dans $PATH
(ce qui devrait être le cas si vous avez suivi la recette), utilisez la ligne de commande suivante:
% salmon index -t gencode.v32.transcripts.fa -i human.gencode.v32.transcripts.index
salmonIndexes
un nouveau répertoire appelé human.gencode.v32.transcripts.index
contenant un série de fichiers que salmon
utilisera pour sa recherche.
% cd ../monAnalyse
% ls PATH/vers/fichiers/FASTQ sample_1_ctrl sample_1_ctrl.filtered.R1.fastq.gz sample_1_ctrl.filtered.R2.fastq.gz sample_2_ctrl etc... sample_3_ctrl etc... sample_1_treated etc... sample_2_treated etc... sample_3_treated etc...
% for i in 1..3; do mkdir sample_$i_ctrl;done % for i in 1..3; do mkdir sample_$i_treated;done
salmon
:
% cd sample_1_ctrl % salmon quant -i ~/salmonIndexes/human.gencode.v32.transcripts.index \ -1 PATH/vers/fichiers/FASTQ/sample_1_ctrl/sample_1_ctrl.filtered.R1.fastq.gz \ -2 PATH/vers/fichiers/FASTQ/sample_1_ctrl/sample_1_ctrl.filtered.R2.fastq.gz \ -l A -p 8 --validateMappings -o ./sample_1_ctrl_quant