Filtrage des ensembles de données
Introduction
Il est toujours nécessaire de filtrer les ensembles de données obtenus suivant le processus de normalisation. Pourquoi? Parce que nous allons utiliser des tests statistiques sur chacune des sondes contenues sur une puce (quel que soit sa nature), nous devrons vivre avec les conséquences de ces hypothèses multiples: un plus ou moins grand nombre de gènes seront déclarés ayant un expression différentiel alors qu'ils ne le sont pas. La meilleure manière de faire face est de diminuer le plus possible le nombre d'hypothèses à tester en retirant le plus grand nombre de gènes n'ayant pas de pertinence pour l'expérimentateur.
Comment faire ce filtrage? On peut voir le problème de deux manières différentes:
- Filtrage non-spécifique: on retire les sondes basées sur une propriété de chacune de ces sondes dans l'expérience
- Filtrage spécifique: on retire les sondes selon la nature des gènes qu'elles représentent.
Filtrage non-spécifique
Ce filtrage s'applique aux données de l'expérience même. Comme une puce contient toute l'information d'un transcriptome donné, il en découle deux observations:
- Comme aucune cellule ou aucun tissu n'exprime tous les transcripts possibles, un grand nombre de sondes seront négatives car les transcripts correspondants sont absents.
- De plus, un grand nombre de transcripts, même présents, ne verront pas leur expression changé selon les conditions de l'expérience.
Donc, il faut filtrer basé sur ses deux paramètres.
Affymetrix: approche CLI
- Filtre pour Présent / Marginal / Absent
- Méthode
mas5calls()
de la classeaffy
- Méthode
pa.calls()
de la classepanp
. Attention! Ne peut être utilisé que sur les puces U133B et U133 Plus v.2
- Filtrer pour absence de variation
- Plus à suivre
Affymetrix: approche GUI
- Filtre pour Présent / Marginal / Absent
- Plus à suivre…
- Filtrer pour absence de variation
- Plus è suivre
Agilent: approche CLI
- Filtre pour Présent / Marginal / Absent
- Plus à suivre…
- Filtrer pour absence de variation
- Plus è suivre
Agilent: approche GUI
- Filtre pour Présent / Marginal / Absent
- Plus à suivre…
- Filtrer pour absence de variation
- Plus à suivre
Illumina: approche CLI
- Filtre pour Présent / Marginal / Absent
- Plus à suivre…
- Filtrer pour absence de variation
- Plus à suivre
Illumina: approche GUI
- Filtre pour Présent / Marginal / Absent
- Plus à suivre…
- Filtrer pour absence de variation
- Plus à suivre
Filtrage spécifique
- Plus à suivre…