====== Les divers formats de données retrouvés en bio-informatique ====== ===== Introduction ===== Depuis maintenant des lustres, la biologie génère de résultats analogiques: photos, autoradiogrammes, chimiofluorescence, etc. Le changement de paradigme provoqué par les plateformes à haut débit à pousser les biologistes à passer au numérique: toutes, vraiment toutes, les plateformes à haut débit, moteurs du développement des -omiques, ne génèrent QUE des fichiers comme résultats bruts, qui ne se travaillent qu'en utilisant un ordinateur qui crée d'autres fichiers et ainsi de suite. Il devient de première importance de connaitre le format de ces fichiers afin d'utiliser les bons outils pour les manipulés. D'aucune manière, nous cherchons à faire un répertoire exhaustif mais simplement une présentation des problématiques retrouvées et des solutions possibles. — //[[sylvain.foisy@diploide.net|foisys]] 2021/09/16 15:39//— ===== Formats fréquemment retrouvés ===== ==== Formats de séquences biologiques ==== * [[:fr:impilopedia:dataformat:formats_seq:fasta|FASTA]] * [[:fr:impilopedia:dataformat:formats_seq:fastq|FASTQ]] * [[:fr:impilopedia:dataformat:formats_seq:genbank|Genbank]] * [[:fr:impilopedia:dataformat:formats_seq:embl|EMBL]] * [[:fr:impilopedia:dataformat:formats_seq:ddbj|DDBJ]] ==== Formats de description des annotations de séquences ==== * [[:fr:impilopedia:dataformat:formats_annotations:bed|BED]] * [[:fr:impilopedia:dataformat:formats_annotations:gff2_3|GFF2 et GFF3]] * [[:fr:impilopedia:dataformat:formats_annotations:gtf|GTF]] ==== Formats de description structurale ==== * [[:fr:impilopedia:dataformat:formats_struct:pdb|PDB]] * [[:fr:impilopedia:dataformat:formats_struct:ccif|CCIF]] ==== Formats d'alignement de séquences ==== * [[:fr:impilopedia:dataformat:formats_multi:sam_bam|SAM/BAM]]