Filtrage des ensembles de données

Introduction

Il est toujours nécessaire de filtrer les ensembles de données obtenus suivant le processus de normalisation. Pourquoi? Parce que nous allons utiliser des tests statistiques sur chacune des sondes contenues sur une puce (quel que soit sa nature), nous devrons vivre avec les conséquences de ces hypothèses multiples: un plus ou moins grand nombre de gènes seront déclarés ayant un expression différentiel alors qu'ils ne le sont pas. La meilleure manière de faire face est de diminuer le plus possible le nombre d'hypothèses à tester en retirant le plus grand nombre de gènes n'ayant pas de pertinence pour l'expérimentateur.

Comment faire ce filtrage? On peut voir le problème de deux manières différentes:

Filtrage non-spécifique: on retire les sondes basées sur une propriété de chacune de ces sondes dans l'expérience
Filtrage spécifique: on retire les sondes selon la nature des gènes qu'elles représentent.

Filtrage non-spécifique

Ce filtrage s'applique aux données de l'expérience même. Comme une puce contient toute l'information d'un transcriptome donné, il en découle deux observations:

Comme aucune cellule ou aucun tissu n'exprime tous les transcripts possibles, un grand nombre de sondes seront négatives car les transcripts correspondants sont absents.
De plus, un grand nombre de transcripts, même présents, ne verront pas leur expression changé selon les conditions de l'expérience.

Donc, il faut filtrer basé sur ses deux paramètres.

Affymetrix: approche CLI

Filtre pour Présent / Marginal / Absent
- Méthode mas5calls() de la classe affy
- Méthode pa.calls() de la classe panp. Attention! Ne peut être utilisé que sur les puces U133B et U133 Plus v.2

Filtrer pour absence de variation
- Plus à suivre

Affymetrix: approche GUI

Filtre pour Présent / Marginal / Absent
- Plus à suivre…

Filtrer pour absence de variation
- Plus è suivre

Agilent: approche CLI

Filtre pour Présent / Marginal / Absent
- Plus à suivre…

Filtrer pour absence de variation
- Plus è suivre

Agilent: approche GUI

Filtre pour Présent / Marginal / Absent
- Plus à suivre…

Filtrer pour absence de variation
- Plus à suivre

Illumina: approche CLI

Filtre pour Présent / Marginal / Absent
- Plus à suivre…

Filtrer pour absence de variation
- Plus à suivre

Illumina: approche GUI

Filtre pour Présent / Marginal / Absent
- Plus à suivre…

Filtrer pour absence de variation
- Plus à suivre

Filtrage spécifique

Plus à suivre…