Traductions de cette page:

Comment créer un fichier d'ARN contaminant en utilisant les ressources du Genome Browser de UCSC

Comment créer un fichier d'ARN contaminant en utilisant les ressources du Genome Browser de UCSC

Introduction

  • Le site Genome Browser de UCSC est une référence établie dans le domaine des données génimuiques en tout genre. Grâce à sa base de données, il est possible d'afficher plusieurs types d'informations sous forme de pistes ( communément appelées tracks); ce que peu d'utilisateurs réalisent, c'est qu'il est possible d'extraire l'information utilisée pour créer ces pistes directement des bases de données utilisées par le site.
  • Attention: vérifier attentivement les informations obtenues par cette recette avec les données de séquence choisie. DIfférentes versions (builds) des génomes donneront invariablement des positions différentes. Les données ne sont pas interechangeables entre version… Donc, un coup d'oeil pour comparer vos informations avec des données externes est toujours une bonne idée :-)

Protocole

  • Diriger vous vers genome.ucsc.edu et Sélectioner Table Browser sous le menu Tools. Vous devriez voir ceci:

  • Sélectionner le génome désiré ainsi que la version de celui-ci via les menus clade, genome et assembly.
    • Il est critique que la version que vous utiliserez corresponde à la version que vous avez des fichiers de séquences FASTA.
  • Sélectionner l'option All Tables dans le menu group.
  • Sélectionner ensuite l'option “rmsk” dasn le menu table (attention: ce menu est très long…).
  • Comme format de sortie, sélectionner GTF dans le menu output format.
  • Créer un fichier de sortie avec un nom descriptif (par ex.: h_sapiens_hg38_rRNA_tRNA_contaminants.gtf)
  • Créer un filtre en cliquant create à côté de l'option filter.
  • Dans la fenêtre qui s'ouvrira, créer les deux filtres suivants:
    • Dans repClass, inscrire rRNA;
    • Dans le champs free-form query, inscrire repClass = “tRNA” et choisir l'option OR
    • Cliquer submit
  • Cliquer sur le bouton marqué get output et voilà!
fr/impilopedia/genex/rnaseq/align/contaminant_rna_file_creation_ucsc.txt · Dernière modification : 2021/05/29 15:35 de 127.0.0.1
CC Attribution-Share Alike 4.0 International Sauf mention contraire, le contenu de ce wiki est placé sous les termes de la licence suivante : CC Attribution-Share Alike 4.0 International