====== R/Bioconductor: Utilisation de la librairie arrayQualityMetrics() pour les données Affymetrix ======
===== Introduction =====
La librairie ''arraQualityMetrics'' [(:bioc_aqm)][(:kaufmann_a_2010_1)] est vraiment l'//über//-outil par excellence et celui qui devrait à terme remplacer presque tous les autres. Comprenant les méthodes incluses dans ''simpleaffy'' et ''affQCReport'', il en inclut d'autre tel que l'analyse par composante principale et l'identification des puces hors-normes (//outliers//). Comme il est aussi possible de travailler avec des données qui proviennent d'illumina ou de puces à 2 couleurs, apprendre à l'utiliser vous donne un outil multi-plateforme.
===== Procédure =====
* Placez vous à la racine où se trouve vos fichiers .CEL comme décrit [[:fr:impilopedia:genex:qc:affy_simpleaffy#preparation_et_demarrage_de_r|ici]].
* Charger la librairie ''arrayQualityMetrics''. Si vous voulez créer votre object ''AffyBatch'' avec la fonction ''read.affy()'', il vous faudra aussi charger ''simpleaffy'':
R> library(arrayQualityMetrics)
# optionnel...
R> library(simpleaffy)
* ''arrayQualityMetrics'' peut utiliser les informations phénotypiques créées via la méthode ''read.affy(covdesc="covdesc_fichier.txt")'' ou la méthode ''ReadAffy(phenoData="covdesc2_fichier.txt")'' tel que décrit [[:fr:impilopedia:genex:qc:affy_simpleaffy#creation_de_l_objet_affybatch|ici]].
* Il faut ensuite donner à manger la structure de données à ''arrayQualityMetrics'':
# imaginons que c'est r.data
# Le parametre grouprep n'est plus
# nécessaire avec intgroup
R>arrayQualityMetrics(
+ expressionset=r.data,
+ outdir="../la_bas",
+ do.logtransform=TRUE,
+ intgroup="MesClasses",
+ spatial=FALSE)
* La commande va prendre un certain temps (!!) alors soyez patient… En résumé, elle fait la chose suivante:
* On utilise l'objet ''r.data'';
* La méthode écrira ses résultats dans le répertoire ''../la_bas'';
* Les graphes sont construits avec une échelle logarithmique;
* Les identificateurs sont dans la colonne ''MesClasses'' de mon fichier ''covdesc_fichier.txt'';
* J'aimerais que les résultats soient regroupés selon les classes définies par ''MesClasses'';
* Je ne veux pas de calcul des représentations spatiales des signaux d'intensité.
* Pourquoi je ne veux pas de représentation spatiale?
* Parce que c'est extrêmement long à calculer;
* Parce que ça prends énormément de ressources (pire avec certaines puces très chargées ou bien un grand nombre de puces);
* Le fichier PDF obtenu est énorme et très difficile à lire;
* On peux obtenir une information équivalente avec les images des résiduels de ''affyPLM()''.
La librarie est très flexible est permet de n'utiliser que certaines de ces fonctions. Voir la documentation pour les marches à suivre.
===== Références =====
notes-separator : none