Les SNPs sont parmi les mutations les plus représentées et sont responsables d’une grande part des variations phénotypiques observées notamment en raison d’altérations structurales.
Une grande quantité d’information pouvant servir d’indice quant à l’impact des SNPs au niveau structural est disponible de façon éparse et lacunaire.
Buts
Agréger les données disponibles;
Générer les données manquantes;
Attribuer des valeurs prédictives d’impact structuraux;
Fournir des jeux de données directement intégrables par un projet associé;
Automatiser l’ensemble du processus.
Méthodologie
Collecte des données génomiques et protéiques
Contrôle qualité, cohérence et normalisation
Génération des indicateurs pour l’étude structurale (protocole GALT-DB)
Technique
Scriptage : Perl / Python / Bash
Formats sources : FASTA / PDB / CSV / HTML / JSON /
Récupération des données : SQL / API / Parsing / MySQL Workbench