Différences

Ci-dessous, les différences entre deux révisions de la page.

Lien vers cette vue comparative

Les deux révisions précédentesRévision précédente
fr:impilopedia:genex:microarrays:acquire:illumina:via_lumi [2019/11/27 14:44] – [R/Bioconductor: Utilisation de la librairie lumi()] foisysfr:impilopedia:genex:microarrays:acquire:illumina:via_lumi [2021/05/29 15:35] (Version actuelle) – modification externe 127.0.0.1
Ligne 1: Ligne 1:
 +====== R/Bioconductor: Utilisation de la librairie lumi ======
  
 +===== Introduction =====
 +
 +La librarie ''lumi''[(:bioc_lumi_qc)] est utilisée pour créer des objets de type ''LumiBatch'', qui sont utilisables par d'autres libraries Bioconductor car ces objets sont des implémentations de l'interface ''ExpressionSet''. En plus de permettre la lecture intelligente des fichiers de sortie du logiciel BeadStudio d'illumina, ''lumi'' comprends plusieurs routines de contrôle de la qualité très utiles pour déterminer la valeur d'une expérience.
 +===== Procédure =====
 +
 +  * Pour faire une analyse de contrôle de qualité en utilisant ''lumi()'', il faut démarrer avec une session R:
 +
 +<code bash>
 +# Tres dur a faire...
 +% R
 +</code>
 +
 +  * En parallèle, il vous faut créer un fichier texte, ''infos_data.txt'', qui contiendra deux colonnes:
 +    * La première colonne est l'identificateur de chaque échantillon, celui qui précède l'information ''AVG_Signal''. Par exemple: si l'en-tête de colonne s'appelle ''Sample01.AVG_Signal'', alors l'identificateur de l'échantillon est Sample01. **Prenez note**: la première cellule de cette première ligne doit avoir une étiquette unique, tel que ''sampleID''.
 +    * La deuxième colonne dénote la classe de chaque échantillon, par exemple, Contrôle vs. Expérience. De la même manière que le première colonne, la cellule de la première ligne devrait avoir une étiquette unique tel que ''Class''.  
 +
 +==== Lecture du fichier de données et création de l'objet LumiBatch ====
 +
 +  * Il faut se positionner dans le système de fichiers dans le dossier qui contient notre fichier de données. Contrairement à la plate-forme Affymetrix qui crée un fichier par puce, la plate-forme Illumina crée un seul fichier de données, avec un ensemble de colonnes pour chaque échantillon.
 +<code rsplus>
 +R> setwd("/path/to/data/file")
 +</code>
 +
 +  * Charger la librarie ''lumi'':
 +<code rsplus>
 +R> library(lumi)
 +</code>
 +
 +  * Créer l'objet ''LumiBatch'' que nous appèlerons ''r.lumi'':
 +<code rsplus>
 +R> r.lumi<-lumiR('fichier_de_donnees_des_probes.txt',sampleInfoFile='info_data.txt')
 +</code>
 +
 +  * Après quelques minutes, vous devriez avoir le retour du curseur. Pour vous assurez que tout va bien, tentez ceci:
 +<code rsplus>
 +R> r.lumi
 +</code>
 +
 +  * Vous devriez obtenir les infos de base sur votre nouvel objet:
 +<code rsplus>
 + Summary of data information:
 + Data File Information:
 +
 +# blablabla...
 +</code>
 +
 +==== Sauvegarde de la matrice de données ====
 +
 +Nous pourrions maintenant vouloir sauvegarder la matrice de données:
 +
 +<code rsplus>
 +R> write.exprs(r.lumi, file='processedData.txt')
 +</code>
 +
 +Vous obtiendrez un fichier texte avec comme première colonne, le ''nuID'' définit par ''lumi'' et une colonne pour chaque échantillon contenu dans le fichier d'origine. Il y a cependant un hic: si vous regardez la façon de représenter un ''nuID'', ça ne ressemble pas à grand chose... Il faut faire un //mapping// entre les identificateurs ''nuID'' et ceux plus conventionnels comme RefSeq et Entrez Gene:
 +
 +<code rsplus>
 +R> nu<-featureNames(r.lumi)
 +R> mapInfo<-getNuIDMappingInfo(nu,lib.mapping='lumiHumanIDMapping')
 +R> write.table(mapInfo,file="./nuID2RefSeq.txt",quote=FALSE,sep="\t")
 +</code>
 +
 +Il faudra fusionner les deux fichiers dans un tableur de votre choix pour obtenir les correspondances.
 +
 +===== Références =====
 +
 +<refnotes> notes-separator: none </refnotes>