Dans la très grande majorité des cas, le travail consistera dans un premier temps à expédier des ARNs extraits suivant divers traitements à un centre de service spécialisé qui procèdera au séquençage à proprement parlé. Suite à ce séquençage, ce centre de service mettra à votre disposition divers fichiers et/ou données quantitatives (par exemple, le nombre de nucléotides séquencés pour chaque librairie, la qualité moyenne, etc.) que vous devez garder quelque part dans un système de fichiers; il vous permettra aussi de télécharger les fichiers de séquences brutes ainsi que les signatures MD5 pour chacun des fichiers de données brutes. Avertissement: cette opération pourrait vous prendre du temps, beaucoup de temps… surtout si votre bande passante est un goulot d'étranglement.
Prenez note : la plupart des méthodes présentées utilisent des données Illumina car ce sont celles avec lesquelles nous avons le plus d'expérience. Si elles ne s'appliquent pas pour d'autres plateformes ou bien demandent des modifications pour fonctionner, svp nous le signaler!
Dans la très grande majorité des cas, le travail consistera dans un premier temps à expédier des ARNs extraits suivant divers traitements à un centre de service spécialisé qui procèdera au séquençage à proprement parlé. Suite à ce séquençage, ce centre de service mettra à votre disposition divers fichiers et/ou données quantitatives (par exemple, le nombre de nucléotides séquencés pour chaque librairie, la qualité moyenne, etc.) que vous devez garder quelque part dans un système de fichiers; il vous permettra aussi de télécharger les fichiers de séquences brutes ainsi que les signatures MD5 pour chacun des fichiers de données brutes. Avertissement: cette opération pourrait vous prendre du temps, beaucoup de temps… surtout si votre bande passante est un goulot d'étranglement.
Prenez note : la plupart des méthodes présentées utilisent des données Illumina car ce sont celles avec lesquelles nous avons le plus d'expérience. Si elles ne s'appliquent pas pour d'autres plateformes ou bien demandent des modifications pour fonctionner, svp nous le signaler!
mon_projet
dans lequel vous créerez un répertoire 0.seq_brutes
; dirigez vous vers ce répertoire. Créez deux autres répertoires dans celui-ci: 0a.seq_brutes_fichiers
et 0b.seq_brutes_qc
. Téléchargez vos données sous 0a.seq_brutes_fichiers
selon les instructions de votre plateforme de service; une fois le téléchargement terminé, si nécessaire, créez les répertoires nécessaires pour distribuer vos fichiers bruts selon votre design expérimental (par exemple: maConditionA_repetition_1
).sort
de samtools
; bamtofastq
de l'utilitaire bedtools
pour faire la transformation BAM → FASTQ; si on a des séquences paired-end, il faudra s'assurer d'utiliser le paramètre -fq2
:% samtools sort -n myOriginal.bam > mySortedOriginal.bam % bedtools bamtofastq -i mySortedOriginal.bam -fq mySortedOriginal.R1.fastq -fq2 mySortedOriginal.R2.fastq