R/Bioconductor: Utilisation de la librairie affyPLM() pour la normalisation et la sommation
Introduction
La librairies affyPLM
est à la base, une librairie pour la normalisation des données Affymetrix en utilisant des modèles basés sur l'intensité de sondes en addition à une normalisation RMA. La normalisation et la sommation se font via la méthode threestep()
, qui présente à l'usager diverses possibilités (même MAS5!):
> eset <- threestep(plm.data, background.method = "RMA.2", + normalize.method = "quantile", + summary.method = "median.polish")
Voici les diverses valeurs disponibles pour les trois paramètres de base de la méthode:
- Pour le paramètre
background.method
:
Option | Description de la méthode |
---|---|
RMA.2 (valeur par défault) | RMA convolution model background |
RMA.1 | RMA convolution model background |
MAS | MAS 5.0 location dependent background |
IdealMM | Ideal Mismatch |
MASIM | MAS 5 and Ideal Mismatch |
GCRMA | GCRMA background |
- Pour le paramètre
normalize.method
:
Option | Description de la méthode |
---|---|
quantile (valeur par défault) | Normalisation par quantile |
scaling | Normalisation proportionnelle |
- Pour le paramètre
summary.method
:
Option | Description de la méthode |
---|---|
median.polish (valeur par défault) | Ajustement des médianes |
tukey.biweight | Binomiale de Tukey |
average.log | Moyenne des valeurs logarithmiques |
log.average | Logarithme des valeurs moyennes |
median.log | Médiane des valeurs logarithmiques |
log.median | Logarithme des valeurs médianes |
log.2nd.largest | 2ème plus grande valeur PM |
lm | Modèle linéaire |
rlm | Modèle linéaire robuste |
Pour avoir plus d'information sur les autres paramètres possible pour la fonction threestep()
, utilisez la fonction d'aide de R:
R>help(threestep)
Procédure
- Ici, on assume que vous avez été en mesure de créer un objet
AffyBatch
tel que décrit sur cette page et que vous l'avez appelér.data
.
- Si la librairie
affyPLM
n'a pas été encore utilisée, il faut la charger en mémoire:
R>library(affyPLM)
- Il faut créer l'objet
PLMset
qu'utiliseras la fonctionthreestep()
:
R>plm.data<-fitPLM(r.data)
- Il est alors très simple d'utiliser
threestep
:
R>norm.data<-threestep(plm.data)
- Cette dernière commande est équivalente à cette commande:
R>norm.data<-threestep(plm.data, + background.method="RMA.2", + normalize.method="quantile", + summary.method="median.polish")
- Il ne reste plus qu'à écrire votre fichier de données normalisées sous la forme d'un fichier texte contenant vos données tabulées:
R>write.exprs(norm.data,file="my_data_normalized.txt")