Différences
Ci-dessous, les différences entre deux révisions de la page.
Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
fr:impilopedia:genex:rnaseq:countsfromreads:counts_easyrnaseq [2017/06/16 12:32] – [Protocole] foisys | fr:impilopedia:genex:rnaseq:countsfromreads:counts_easyrnaseq [2021/05/29 15:35] (Version actuelle) – modification externe 127.0.0.1 | ||
---|---|---|---|
Ligne 1: | Ligne 1: | ||
+ | ====== Obtenir une matrice de valeurs d' | ||
+ | ===== Introduction ===== | ||
+ | |||
+ | * Plus à venir... | ||
+ | |||
+ | ===== Protocole ===== | ||
+ | |||
+ | //Note//: le protocole qui suit fonctionne avec les dernières versions de R et Bioconductor (3.4 et 3.5 respectivement, | ||
+ | |||
+ | * Il vous faut les fichiers suivants: | ||
+ | * Un répertoire contenant TOUS vos fichiers d' | ||
+ | * Le fichier d' | ||
+ | * Démarrez R et chargez la librairie '' | ||
+ | <code rsplus> | ||
+ | > library(" | ||
+ | </ | ||
+ | |||
+ | * Il faut se placer dans le répertoire où se trouve les liens symboliques: | ||
+ | <code rsplus> | ||
+ | > setwd("/ | ||
+ | </ | ||
+ | * On utilise les méthodes de manipulation de fichiers de R ainsi que la méthode '' | ||
+ | <code rsplus> | ||
+ | # Permet de créer un vecteur contenant la liste des fichiers désirés | ||
+ | # Si nécessaire, | ||
+ | > bamFiles< | ||
+ | path=" | ||
+ | pattern=" | ||
+ | ) | ||
+ | # Transformer le vector pour extraire les vrais chemins des fichiers | ||
+ | > bamFiles< | ||
+ | # Créer l' | ||
+ | > bamFiles< | ||
+ | </ | ||
+ | * Il faut ensuite traiter le fichier d' | ||
+ | <code rsplus> | ||
+ | # Si on utilise un fichier GTF | ||
+ | # Pour GFF3 simplement remplacé gtf par gff3 | ||
+ | > annPar< | ||
+ | datasource="/ | ||
+ | type=" | ||
+ | ) | ||
+ | |||
+ | # easyRNASeq doit par la suite créer un table d' | ||
+ | # via l' | ||
+ | # transcrits | ||
+ | > annPar< | ||
+ | |||
+ | # Avec le fichier genes.gtf de Illumina-iGenome pour GRCh38 v.2015 | ||
+ | # Ça donne ça: | ||
+ | > getAnnotation(annPar) | ||
+ | No validation performed at that stage | ||
+ | GRanges object with 276766 ranges and 3 metadata columns: | ||
+ | | ||
+ | < | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | | ||
+ | [276762] | ||
+ | [276763] | ||
+ | [276764] | ||
+ | [276765] | ||
+ | [276766] | ||
+ | gene | ||
+ | < | ||
+ | [1] DDX11L1 | ||
+ | [2] DDX11L1 | ||
+ | [3] DDX11L1 | ||
+ | | ||
+ | | ||
+ | | ||
+ | [276762] | ||
+ | [276763] | ||
+ | [276764] | ||
+ | [276765] | ||
+ | [276766] | ||
+ | ------- | ||
+ | seqinfo: 282 sequences from an unspecified genome; no seqlengths | ||
+ | |||
+ | </ | ||
+ | * Il reste à créer un objet '' | ||
+ | <code rsplus> | ||
+ | # Selon les paramètres du rnaseq effectué | ||
+ | > bamPar<- BamParam( | ||
+ | paired = T, | ||
+ | stranded = F | ||
+ | ) | ||
+ | |||
+ | # Selon les informations souhaitées: | ||
+ | # countBy = c(" | ||
+ | # precision = c(" | ||
+ | # Dans la plupart des cas, c'est " | ||
+ | > rnaSeqPar< | ||
+ | annotParam = annPar, | ||
+ | bamParam = bamPar, | ||
+ | countBy = " | ||
+ | precision = " | ||
+ | ) | ||
+ | </ | ||
+ | * Dernière étape: faire le décompte ;-) Sur un cluster, on peut utiliser le paramètre '' | ||
+ | <code rsplus> | ||
+ | > exp <- simpleRNASeq( | ||
+ | bamFiles=bamFiles, | ||
+ | param=rnaSeqPar, | ||
+ | verbose=TRUE | ||
+ | ) | ||
+ | </ | ||
+ | * Ça va prendre du temps... | ||
+ | * Plus à venir... |