Traductions de cette page:
Piste : affy_affyqcreport

R/Bioconductor: Utilisation de la librairie affyQCReport()

R/Bioconductor: Utilisation de la librairie affyQCReport()

Introduction

La librarie affyQCReport(1) permet la création automatique d'un rapport de contrôle de qualité qui comprend plusieurs des méthodes retrouvées dans le duo affy/simpleaffy: boîte à moustache, graphe de contrôle de qualité des sondes QC Affymetrix, etc. Il ajoute un test de corrélation par rang de Spearman, très intéressant pour juger des relations entre les puces; par exemple, est-ce que les échantillons contrôle sont tous semblables?

Procédure

  • Pour faire une analyse de contrôle de qualité en utilisant affyQCReport(), il faut démarrer avec une session R:
# Operation tres complexe...
% R
  • Dans une installation Impilo, vous pouvez utilisez l'interface graphique de la console R avec le menu Impilo > Analyse statistique > R GUI.
  • Dans un cas comme dans l'autre, il vous faudra désigner un répertoire de travail, spécifiquement l'endroit où se trouve les fichiers .CEL. Cet endroit deviendra votre workspace (en language R):
    • Méthode R GUI: Il vous faut sélectionner le nouveau répertoire de travail grâce à la commande File > Set Working Directory
    • Méthode console: Utilisez la commande suivante:
R> setwd("/vers/repertoire/fichiers/cel")
  • Il vous faut charger la librarie affyQCReport dans votre session R. Vous verrez à la console que R charge les librairies dont dépend affyQCReport.
R> library("affyQCReport")
  • Il faut ensuite construire un objet de type AffyBatch. Comme affyQCReport a besoin de affy ET de simpleaffy, les méthodes read.affy et ReadAffy utilisées ici fonctionnent très bien. Par exemple:
R> data<-read.affy(covdesc="covdesc")
  • Le rapport comprenant les diverses métriques de mesure de la qualité est finalement créer sous un nom distinctif:
R> QCReport(data,file="myQCReport.pdf")
  • Le rapport contient six sections, chacune avec une analyse particulière de la qualité des résultats bruts:
    • Page 1: une simple liste des fichiers utilisées avec un nombre, de 1 à n pour identification dans les graphes subséquents.
    • Page 2: cette page comprends deux graphes, l'un étant un graphe en boîte à moustache des intensités des sondes PM et le deuxième étant un graphe des distributions de ces intensités. N'importe quel puce donnant un profil discordant par rapport aux autres devrait vous rendre nerveux sur sa qualité…
    • Page 3: c'est le même graphe de contrôle qualité qui est la valeur ajoutée du package simpleaffy. Voir la documentation de ce package pour l'interprétation exacte mais il est suffisant de dire que tout ce qui est rouge est suspect…
    • Page 4: affyQCReport analyse les données des sondes contrôles négatives et positives qui se trouvent en bordure des puces. Si les données sont bonnes, on devrait observé que les moyennes et les écart-types devraient être comparable d'une puce à l'autre dans les deux cas. Si on observe de grosse variations dans les contrôles positifs, on a probablement affaire à une hybridation inégale; si c'est le cas des contrôles négatifs, on va probablement observé un bruit de fonds élevé.
    • Page 5: une autre utilisation des données contrôle est l'analyse des variations spatiales, donc de erreurs d'hybridation. Comme on connait la position de toutes les sondes, affyQCReport utilise les données d'intensité et les données de position pour déterminer pour chaque puce un centre d'intensité ou COI. Si l'hybridation est uniforme, la position de ce COI devrait être près du centre. Il est évident qu'on observe un certaine variabilité mais si une puce est très divergente, on la trouvera en outlier dans le graphe.
    • Page 6: cette page est un graphe des coefficients de corrélation de Spearman pour les puces. Comme l'auto-correlation donne toujours une valeur de 1, il faut regarder de chaque côté de la diagonale. Ce graphe est très utile pour voir si l'échantillonnage a bien fonctionné car on devrait, par exemple très bien séparer les puces témoins des puces cas.
  • Il est possible d'obtenir également uniquement des portions du rapport avec les fonctions suivantes:
    • titlePage(data,file=“myFunction.pdf”): page 1
    • signalDist(data,file=“myFunction.pdf”): page 2
    • plot(qc(data),file=“myFunction.pdf”): page 3
    • borderQC1(data,file=“myFunction.pdf”): page 4
    • borderQC2(data,file=“myFunction.pdf”): page 5
    • correlationPlot(data,file=“myFunction.pdf”): page 6
  • Selon la documentation, les méthodes devraient être capables d'utiliser les infos phénotypiques de l'objet AffyBatch mais il semble que seule la méthode ReadAffy() crée ce qu'il faut. Si ce n'est pas le cas, faites le nous savoir.

Références

fr/impilopedia/genex/microarrays/qc/affy_affyqcreport.txt · Dernière modification : 2021/05/29 15:35 de 127.0.0.1
CC Attribution-Share Alike 4.0 International Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC Attribution-Share Alike 4.0 International