Note: le protocole qui suit fonctionne avec les dernières versions de R et Bioconductor (3.4 et 3.5 respectivement, en date de juin 2017).
easyRNASeq
:> library("easyRNASeq")
> setwd("/chemin/vers/les/liens/symboliques")
getBamFileList
de easyRNASeq
:# Permet de créer un vecteur contenant la liste des fichiers désirés # Si nécessaire, utilisez un patron commun pour filtrer les fichiers désirés > bamFiles<-list.files( path=".", pattern="*.properly_paired.*.bam$" ) # Transformer le vector pour extraire les vrais chemins des fichiers > bamFiles<-Sys.readlink(bamFiles) # Créer l'objet BamFilesList nécessaire > bamFiles<-getBamFileList(bamFiles)
easyRNASeq
:# Si on utilise un fichier GTF # Pour GFF3 simplement remplacé gtf par gff3 > annPar<-AnnotParam( datasource="/un/chemin/vers/fichier/GTF", type="gtf" ) # easyRNASeq doit par la suite créer un table d'annotations # via l'analyse des exons pour créer une carte virtuelle des # transcrits > annPar<-createSyntheticTranscripts(annPar) # Avec le fichier genes.gtf de Illumina-iGenome pour GRCh38 v.2015 # Ça donne ça: > getAnnotation(annPar) No validation performed at that stage GRanges object with 276766 ranges and 3 metadata columns: seqnames ranges strand | exon transcript <Rle> <IRanges> <Rle> | <Rle> <Rle> [1] chr1 [11874, 12227] + | DDX11L1.exon.1 DDX11L1.0 [2] chr1 [12613, 12721] + | DDX11L1.exon.2 DDX11L1.0 [3] chr1 [13221, 14409] + | DDX11L1.exon.3 DDX11L1.0 [4] chr1 [14362, 14829] - | WASH7P.exon.11 WASH7P.0 [5] chr1 [14970, 15038] - | WASH7P.exon.10 WASH7P.0 ... ... ... ... . ... ... [276762] chrY [57190940, 57191085] + | IL9R-2.exon.6 IL9R-2.0 [276763] chrY [57191798, 57191999] + | IL9R-2.exon.7 IL9R-2.0 [276764] chrY [57192603, 57192708] + | IL9R-2.exon.8 IL9R-2.0 [276765] chrY [57194043, 57194127] + | IL9R-2.exon.9 IL9R-2.0 [276766] chrY [57196336, 57197337] + | IL9R-2.exon.10 IL9R-2.0 gene <Rle> [1] DDX11L1 [2] DDX11L1 [3] DDX11L1 [4] WASH7P [5] WASH7P ... ... [276762] IL9R-2 [276763] IL9R-2 [276764] IL9R-2 [276765] IL9R-2 [276766] IL9R-2 ------- seqinfo: 282 sequences from an unspecified genome; no seqlengths
RnaSeqParam
pour contenir les paramètres du décompte:# Selon les paramètres du rnaseq effectué > bamPar<- BamParam( paired = T, stranded = F ) # Selon les informations souhaitées: # countBy = c("exons", "features", "genes","transcripts") # precision = c("read", "bp") # Dans la plupart des cas, c'est "read" qui sera utilisé > rnaSeqPar<-RnaSeqParam( annotParam = annPar, bamParam = bamPar, countBy = "genes", precision = "read" )
nnodes
pour spécifier le nombre de CPU à utiliser pour accélérer le calcul; la valeur par défaut est nnodes=1
.> exp <- simpleRNASeq( bamFiles=bamFiles, param=rnaSeqPar, verbose=TRUE )