Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
Prochaine révision
Révision précédente
fr:impilopedia:genex:rnaseq:countsfromfastq:counts_salmon [2019/12/04 08:12] – [1ère étape: construire un index des séquences d'un transcriptome de référence] foisysfr:impilopedia:genex:rnaseq:countsfromfastq:counts_salmon [2021/05/29 15:35] (Version actuelle) – modification externe 127.0.0.1
Ligne 1: Ligne 1:
 +====== Quantification de transcrits avec Salmon ======
 +
 +===== Introduction =====
 +
 +Salmon [(:patro_r_2017)] est une application de quantification qui ne demande pas l'alignement préalable des séquences FASTQ sur un génome de référence. À partir d'un index des séquences contenu dans un transcriptome de référence, Salmon en mode //mapping// procède à un alignement et crée un table de l'abondance de chaque transcrit représenté dans les fichiers FASTQ //paired-end//.
 +
 +Note importante: Salmon ne fait pas la découverte de nouveau transcrits pas plus qu'il ne peut trouver de nouveaux exons. Il trouvera uniquement les séquences qui sont représentées dans le transcriptome de référence.
 +
 +===== Protocole =====
 +
 +==== Étapes préliminaires ====
 +
 +  * En premier, assumons que nous avons des fichiers //paired-end// en format FASTQ qui ont été filtrés pour en retirer les séquences de mauvaise qualité (selon vos critères).
 +  * Deuxièmement, nous travaillons dans notre répertoire racine usager.
 +<sxh bash>
 +% cd && mkdir monAnalyse
 +</sxh>
 +  * Finalement, nous avons des fichiers d'annotations des transcrits pour le génome étudié. Pour notre exemple, nous utiliserons les fichiers provenant du [[https://www.gencodegenes.org|projet Gencode]].
 +<sxh bash>
 +% mkdir salmonIndexes
 +% cd salmonIndexes
 +% curl -L -O ftp://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_human/release_32/gencode.v32.transcripts.fa.gz
 +% unzip gencode.v32.transcripts.fa.gz
 +</sxh>
 +
 +==== 1ère étape: construire un index des séquences d'un transcriptome de référence  ====
 +
 +  * Il faut utiliser ''salmon'' en mode index afin de créer l'index de recherche que ''salmon'' utilisera pour sa recherche de transcrits.
 +  * En assumant que nous sommes toujours dans ''~/salmonIndexes'' et que ''salmon'' se trouve dans ''$PATH'' (ce qui devrait être le cas si vous avez suivi la [[fr:install:bin_app_repository:18_04_a19_build:salmon_0141|recette]]), utilisez la ligne de commande suivante:
 +<sxh bash>
 +% salmon index -t gencode.v32.transcripts.fa -i human.gencode.v32.transcripts.index 
 +</sxh>
 +  * À la fin du processus, vous trouverez dans le répertoire ''salmonIndexes'' un nouveau répertoire appelé ''human.gencode.v32.transcripts.index'' contenant un série de fichiers que ''salmon'' utilisera pour sa recherche.
 +  * Il va s'en dire que cette indexation devra être refaite à chaque mise à jour du fichier de transcrits.
 +
 +==== 2ème étape: procéder à l'alignement et au calcul d'abondance ====
 +
 +  * On remonte d'un niveau et on s'en va dans notre dossier d'analyse:
 +<sxh bash>
 +% cd ../monAnalyse
 +</sxh>
 +  * Assumons que les fichiers FASTQ sont dans une arborescence logique (pour permettre une certaine automation; projet à venir...):
 +<sxh bash>
 +% ls PATH/vers/fichiers/FASTQ
 +sample_1_ctrl
 +  sample_1_ctrl.filtered.R1.fastq.gz
 +  sample_1_ctrl.filtered.R2.fastq.gz
 +sample_2_ctrl
 +  etc...
 +sample_3_ctrl
 +  etc...
 +sample_1_treated
 +  etc...
 +sample_2_treated
 +  etc...
 +sample_3_treated
 +  etc...
 +</sxh>
 +  * On calque cette structure dans notre répertorie d'analyse:
 +<sxh bash>
 +% for i in 1..3; do mkdir sample_$i_ctrl;done
 +% for i in 1..3; do mkdir sample_$i_treated;done
 +</sxh>
 +  * On se dirige dans le premier et on lance l'analyse quantitative ''salmon'':
 +<sxh bash>
 +% cd sample_1_ctrl
 +% salmon quant -i ~/salmonIndexes/human.gencode.v32.transcripts.index \
 +         -1 PATH/vers/fichiers/FASTQ/sample_1_ctrl/sample_1_ctrl.filtered.R1.fastq.gz \
 +         -2 PATH/vers/fichiers/FASTQ/sample_1_ctrl/sample_1_ctrl.filtered.R2.fastq.gz \
 +         -l A -p 8 --validateMappings -o ./sample_1_ctrl_quant
 +</sxh>
 +  * Plus à venir...
 +===== Références =====
 +<refnotes> 
 +notes-separator : none 
 +</refnotes>