Différences
Ci-dessous, les différences entre deux révisions de la page.
| Les deux révisions précédentesRévision précédenteProchaine révision | Révision précédente | ||
| fr:impilopedia:genex:rnaseq:airway_project:index_creation_main [2026/02/12 15:21] – [Téléchargement des fichiers d'annotation] foisys | fr:impilopedia:genex:rnaseq:airway_project:index_creation_main [2026/02/18 16:05] (Version actuelle) – [Création des index : usage de scripts pour SLURM] foisys | ||
|---|---|---|---|
| Ligne 12: | Ligne 12: | ||
| * Pour commencer, il faut aller chercher les fichiers d' | * Pour commencer, il faut aller chercher les fichiers d' | ||
| <sxh bash> | <sxh bash> | ||
| - | # On assume que l'on se dirige vers / | + | # On assume que l'on se dirige vers / |
| - | # Ajuster en fonction de votre environnement | + | # les répertoires nécessaires |
| - | % cd / | + | # Ajuster en fonction de votre environnement, évidemment! |
| - | % mkdir gencode_annotations | + | % mkdir / |
| + | % mkdir / | ||
| + | % cd / | ||
| + | % mkdir gencode | ||
| # Dernière version en date | # Dernière version en date | ||
| - | % mkdir gencode_annotations/r49 | + | % mkdir gencode/r49 |
| - | % cd gencode_annotations/r49 | + | % cd gencode/r49 |
| # Fichier avec les annotations complètes en format GTF | # Fichier avec les annotations complètes en format GTF | ||
| % curl -L -O https:// | % curl -L -O https:// | ||
| Ligne 31: | Ligne 34: | ||
| </ | </ | ||
| - | * Si une nouvelle version (disons r50) est publiée, simplement créez un répertoire sous ''/ | + | * Si une nouvelle version (disons r50) est publiée, simplement créez un répertoire sous ''/ |
| ==== Création des index : usage de scripts pour SLURM ==== | ==== Création des index : usage de scripts pour SLURM ==== | ||
| + | |||
| + | Créer les index pour les outils d' | ||
| + | |||
| + | * C'est un processus qui prend du temps... Les outils sont capables d' | ||
| + | * C'est un processus qui construit des structures de données qui habitent en premier en mémoire vive et ça demande beaucoup, beaucoup de mémoire vive. | ||
| + | |||
| + | Si on prend pour exemple la grappe de calcul Rorqual, on y trouve des serveurs qui ont tout ce que nous aurons de besoin, il faut simplement leur dire commente faire. En passant, faire cette construction sur une grappe SuperClafoutis n'est pas une option: certaines opérations d' | ||
| + | |||
| + | Comme ce sont des tâches qui demandent du temps (plusieurs minutes à plusieurs heures), c'est le moment idéal pour apprendre à utiliser SLURM. À la base, SLURM est un système où un usager soumet des actions (interactives ou scriptées) via une application ('' | ||
| === Création des index pour HISAT2 === | === Création des index pour HISAT2 === | ||
| + | |||
| + | * HISAT2 construit une série de fichiers qui constituera l' | ||
| + | |||
| + | * Pour commencer, on passe par les scripts Python pour la création des fichiers intermédaires: | ||
| + | <sxh bash> | ||
| + | # On crée l' | ||
| + | % cd / | ||
| + | % mkdir hisat2_indexes | ||
| + | % mkdir hisat2_indexes/ | ||
| + | % mkdir hisat2_indexes/ | ||
| + | |||
| + | # Ici, on assume que HISAT2 est sur le $PATH; les scripts devraient se trouver | ||
| + | # au même niveau que l' | ||
| + | % cd hisat2_indexes/ | ||
| + | # Il faut rediriger la sortie vers un fichier sinon ça sort sur STDOUT... | ||
| + | % hisat2_extract_extract_exons.py / | ||
| + | % hisat2_extract_extract_splice_sites.py / | ||
| + | # Etape facultative: | ||
| + | # Dernière version disponible | ||
| + | % curl -L -O http:// | ||
| + | % gunzip snp151Common.txt.gz | ||
| + | # Ici, le script est un peu plus exigeant... Ça prend plus de temps que les étapes précédentes. | ||
| + | % hisat2_extract_snps_haplotypes_UCSC.py / | ||
| + | </ | ||
| + | |||
| + | * Ok, pour la suite, ça nous prend un serveur bien doté en mémoire vive et SLURM pour lancer cette tâche. Il nous faut écrire un script '' | ||
| + | * À l'aide de '' | ||
| + | <sxh bash> | ||
| + | Plus à venir... | ||
| + | </ | ||
| * Plus à venir... | * Plus à venir... | ||