====== R/Bioconductor: Utilisation de la librairie affyPLM() pour la normalisation et la sommation ====== ===== Introduction ===== La librairies ''affyPLM'' est à la base, une librairie pour la normalisation des données Affymetrix en utilisant des modèles basés sur l'intensité de sondes en addition à une normalisation RMA. La normalisation et la sommation se font via la méthode ''threestep()'', qui présente à l'usager diverses possibilités (même MAS5!): > eset <- threestep(plm.data, background.method = "RMA.2", + normalize.method = "quantile", + summary.method = "median.polish") Voici les diverses valeurs disponibles pour les trois paramètres de base de la méthode: * Pour le paramètre ''background.method'': ^Option ^Description de la méthode | ^RMA.2 (valeur par défault) |RMA convolution model background | ^RMA.1 |RMA convolution model background | ^MAS |MAS 5.0 location dependent background | ^IdealMM |Ideal Mismatch | ^MASIM |MAS 5 and Ideal Mismatch | ^GCRMA |GCRMA background | * Pour le paramètre ''normalize.method'': ^Option ^Description de la méthode | ^quantile (valeur par défault) |Normalisation par quantile | ^scaling |Normalisation proportionnelle | * Pour le paramètre ''summary.method'': ^Option ^Description de la méthode | ^median.polish (valeur par défault) |[[http://www.answers.com/topic/median-polish|Ajustement des médianes]] | ^tukey.biweight |[[http://en.wikipedia.org/wiki/Robust_statistics|Binomiale de Tukey]] | ^average.log |Moyenne des valeurs logarithmiques | ^log.average |Logarithme des valeurs moyennes | ^median.log |Médiane des valeurs logarithmiques | ^log.median |Logarithme des valeurs médianes | ^log.2nd.largest |2ème plus grande valeur PM | ^lm |Modèle linéaire | ^rlm |Modèle linéaire robuste | Pour avoir plus d'information sur les autres paramètres possible pour la fonction ''threestep()'', utilisez la fonction d'aide de R: R>help(threestep) ===== Procédure ===== * Ici, on assume que vous avez été en mesure de créer un objet ''AffyBatch'' tel que décrit sur [[:fr:impilopedia:genex:qc:affy_simpleaffy|cette page]] et que vous l'avez appelé ''r.data''. * Si la librairie ''affyPLM'' n'a pas été encore utilisée, il faut la charger en mémoire: R>library(affyPLM) * Il faut créer l'objet ''PLMset'' qu'utiliseras la fonction ''threestep()'': R>plm.data<-fitPLM(r.data) * Il est alors très simple d'utiliser ''threestep'': R>norm.data<-threestep(plm.data) * Cette dernière commande est équivalente à cette commande: R>norm.data<-threestep(plm.data, + background.method="RMA.2", + normalize.method="quantile", + summary.method="median.polish") * Il ne reste plus qu'à écrire votre fichier de données normalisées sous la forme d'un fichier texte contenant vos données tabulées: R>write.exprs(norm.data,file="my_data_normalized.txt") \\