====== R/Bioconductor: Utilisation de la librairie affyPLM() pour la normalisation et la sommation ======
===== Introduction =====
La librairies ''affyPLM'' est à la base, une librairie pour la normalisation des données Affymetrix en utilisant des modèles basés sur l'intensité de sondes en addition à une normalisation RMA. La normalisation et la sommation se font via la méthode ''threestep()'', qui présente à l'usager diverses possibilités (même MAS5!):
> eset <- threestep(plm.data, background.method = "RMA.2",
+ normalize.method = "quantile",
+ summary.method = "median.polish")
Voici les diverses valeurs disponibles pour les trois paramètres de base de la méthode:
* Pour le paramètre ''background.method'':
^Option ^Description de la méthode |
^RMA.2 (valeur par défault) |RMA convolution model background |
^RMA.1 |RMA convolution model background |
^MAS |MAS 5.0 location dependent background |
^IdealMM |Ideal Mismatch |
^MASIM |MAS 5 and Ideal Mismatch |
^GCRMA |GCRMA background |
* Pour le paramètre ''normalize.method'':
^Option ^Description de la méthode |
^quantile (valeur par défault) |Normalisation par quantile |
^scaling |Normalisation proportionnelle |
* Pour le paramètre ''summary.method'':
^Option ^Description de la méthode |
^median.polish (valeur par défault) |[[http://www.answers.com/topic/median-polish|Ajustement des médianes]] |
^tukey.biweight |[[http://en.wikipedia.org/wiki/Robust_statistics|Binomiale de Tukey]] |
^average.log |Moyenne des valeurs logarithmiques |
^log.average |Logarithme des valeurs moyennes |
^median.log |Médiane des valeurs logarithmiques |
^log.median |Logarithme des valeurs médianes |
^log.2nd.largest |2ème plus grande valeur PM |
^lm |Modèle linéaire |
^rlm |Modèle linéaire robuste |
Pour avoir plus d'information sur les autres paramètres possible pour la fonction ''threestep()'', utilisez la fonction d'aide de R:
R>help(threestep)
===== Procédure =====
* Ici, on assume que vous avez été en mesure de créer un objet ''AffyBatch'' tel que décrit sur [[:fr:impilopedia:genex:qc:affy_simpleaffy|cette page]] et que vous l'avez appelé ''r.data''.
* Si la librairie ''affyPLM'' n'a pas été encore utilisée, il faut la charger en mémoire:
R>library(affyPLM)
* Il faut créer l'objet ''PLMset'' qu'utiliseras la fonction ''threestep()'':
R>plm.data<-fitPLM(r.data)
* Il est alors très simple d'utiliser ''threestep'':
R>norm.data<-threestep(plm.data)
* Cette dernière commande est équivalente à cette commande:
R>norm.data<-threestep(plm.data,
+ background.method="RMA.2",
+ normalize.method="quantile",
+ summary.method="median.polish")
* Il ne reste plus qu'à écrire votre fichier de données normalisées sous la forme d'un fichier texte contenant vos données tabulées:
R>write.exprs(norm.data,file="my_data_normalized.txt")
\\