R/Bioconductor: Utilisation de la librairie affyPLM() pour la normalisation et la sommation
Introduction
La librairies affyPLM est à la base, une librairie pour la normalisation des données Affymetrix en utilisant des modèles basés sur l'intensité de sondes en addition à une normalisation RMA. La normalisation et la sommation se font via la méthode threestep(), qui présente à l'usager diverses possibilités (même MAS5!):
> eset <- threestep(plm.data, background.method = "RMA.2", + normalize.method = "quantile", + summary.method = "median.polish")
Voici les diverses valeurs disponibles pour les trois paramètres de base de la méthode:
- Pour le paramètre
background.method:
| Option | Description de la méthode |
|---|---|
| RMA.2 (valeur par défault) | RMA convolution model background |
| RMA.1 | RMA convolution model background |
| MAS | MAS 5.0 location dependent background |
| IdealMM | Ideal Mismatch |
| MASIM | MAS 5 and Ideal Mismatch |
| GCRMA | GCRMA background |
- Pour le paramètre
normalize.method:
| Option | Description de la méthode |
|---|---|
| quantile (valeur par défault) | Normalisation par quantile |
| scaling | Normalisation proportionnelle |
- Pour le paramètre
summary.method:
| Option | Description de la méthode |
|---|---|
| median.polish (valeur par défault) | Ajustement des médianes |
| tukey.biweight | Binomiale de Tukey |
| average.log | Moyenne des valeurs logarithmiques |
| log.average | Logarithme des valeurs moyennes |
| median.log | Médiane des valeurs logarithmiques |
| log.median | Logarithme des valeurs médianes |
| log.2nd.largest | 2ème plus grande valeur PM |
| lm | Modèle linéaire |
| rlm | Modèle linéaire robuste |
Pour avoir plus d'information sur les autres paramètres possible pour la fonction threestep(), utilisez la fonction d'aide de R:
R>help(threestep)
Procédure
- Ici, on assume que vous avez été en mesure de créer un objet
AffyBatchtel que décrit sur cette page et que vous l'avez appelér.data.
- Si la librairie
affyPLMn'a pas été encore utilisée, il faut la charger en mémoire:
R>library(affyPLM)
- Il faut créer l'objet
PLMsetqu'utiliseras la fonctionthreestep():
R>plm.data<-fitPLM(r.data)
- Il est alors très simple d'utiliser
threestep:
R>norm.data<-threestep(plm.data)
- Cette dernière commande est équivalente à cette commande:
R>norm.data<-threestep(plm.data, + background.method="RMA.2", + normalize.method="quantile", + summary.method="median.polish")
- Il ne reste plus qu'à écrire votre fichier de données normalisées sous la forme d'un fichier texte contenant vos données tabulées:
R>write.exprs(norm.data,file="my_data_normalized.txt")