Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| fr:impilopedia:genex:rnaseq:countsfromreads:counts_easyrnaseq [2017/06/16 14:17] – [Protocole] foisys | fr:impilopedia:genex:rnaseq:countsfromreads:counts_easyrnaseq [2021/05/29 15:35] (Version actuelle) – modification externe 127.0.0.1 | ||
|---|---|---|---|
| Ligne 1: | Ligne 1: | ||
| + | ====== Obtenir une matrice de valeurs d' | ||
| + | ===== Introduction ===== | ||
| + | |||
| + | * Plus à venir... | ||
| + | |||
| + | ===== Protocole ===== | ||
| + | |||
| + | //Note//: le protocole qui suit fonctionne avec les dernières versions de R et Bioconductor (3.4 et 3.5 respectivement, | ||
| + | |||
| + | * Il vous faut les fichiers suivants: | ||
| + |     * Un répertoire contenant TOUS vos fichiers d' | ||
| + |     * Le fichier d' | ||
| + |   * Démarrez R et chargez la librairie '' | ||
| + | <code rsplus> | ||
| + | > library(" | ||
| + | </ | ||
| + | |||
| + |   * Il faut se placer dans le répertoire où se trouve les liens symboliques: | ||
| + | <code rsplus> | ||
| + | > setwd("/ | ||
| + | </ | ||
| + |   * On utilise les méthodes de manipulation de fichiers de R ainsi que la méthode '' | ||
| + | <code rsplus> | ||
| + | # Permet de créer un vecteur contenant la liste des fichiers désirés | ||
| + | # Si nécessaire, | ||
| + | > bamFiles< | ||
| + |     path=" | ||
| + |     pattern=" | ||
| + | ) | ||
| + | # Transformer le vector pour extraire les vrais chemins des fichiers | ||
| + | > bamFiles< | ||
| + | # Créer l' | ||
| + | > bamFiles< | ||
| + | </ | ||
| + |   * Il faut ensuite traiter le fichier d' | ||
| + | <code rsplus> | ||
| + | # Si on utilise un fichier GTF | ||
| + | # Pour GFF3 simplement remplacé gtf par gff3 | ||
| + | > annPar< | ||
| + |     datasource="/ | ||
| + |     type=" | ||
| + | ) | ||
| + | |||
| + | # easyRNASeq doit par la suite créer un table d' | ||
| + | # via l' | ||
| + | # transcrits | ||
| + | > annPar< | ||
| + | |||
| + | # Avec le fichier genes.gtf de Illumina-iGenome pour GRCh38 v.2015  | ||
| + | # Ça donne ça: | ||
| + | > getAnnotation(annPar) | ||
| + | No validation performed at that stage | ||
| + | GRanges object with 276766 ranges and 3 metadata columns: | ||
| + |             | ||
| + |               < | ||
| + |         | ||
| + |         | ||
| + |         | ||
| + |         | ||
| + |         | ||
| + |         | ||
| + |   [276762]  | ||
| + |   [276763]  | ||
| + |   [276764]  | ||
| + |   [276765]  | ||
| + |   [276766]  | ||
| + | gene | ||
| + |              < | ||
| + | [1] DDX11L1 | ||
| + | [2] DDX11L1 | ||
| + | [3] DDX11L1 | ||
| + |         | ||
| + |         | ||
| + |         | ||
| + |   [276762]  | ||
| + |   [276763]  | ||
| + |   [276764]  | ||
| + |   [276765]  | ||
| + |   [276766]  | ||
| + | ------- | ||
| + | seqinfo: 282 sequences from an unspecified genome; no seqlengths | ||
| + | |||
| + | </ | ||
| + |   * Il reste à créer un objet '' | ||
| + | <code rsplus> | ||
| + | # Selon les paramètres du rnaseq effectué | ||
| + | > bamPar<- BamParam( | ||
| + | paired = T, | ||
| + | stranded = F | ||
| + | ) | ||
| + | |||
| + | # Selon les informations souhaitées:  | ||
| + | # countBy = c(" | ||
| + | # precision = c(" | ||
| + | # Dans la plupart des cas, c'est " | ||
| + | > rnaSeqPar< | ||
| + | annotParam = annPar, | ||
| + | bamParam = bamPar, | ||
| + |     countBy = " | ||
| + |     precision = " | ||
| + | ) | ||
| + | </ | ||
| + |   * Dernière étape: faire le décompte ;-) Sur un cluster, on peut utiliser le paramètre '' | ||
| + | <code rsplus> | ||
| + | > exp <- simpleRNASeq( | ||
| + |     bamFiles=bamFiles, | ||
| + |     param=rnaSeqPar, | ||
| + | verbose=TRUE | ||
| + | ) | ||
| + | </ | ||
| + | * Ça va prendre du temps... | ||
| + | * Plus à venir... | ||