BIOINFORMATIQUE ET CONTRAINTES

David Gilbert et Rolf Backofen

Résumé

La bioinformatique est un domaine passionnant et en rapide expansion qui, en utilisant les méthodes informatiques, s'applique à résoudre les problèmes surgissant de la biologie. Ces travaux dirigés ont pour but de présenter ce sujet aux informaticiens et de souligner les différents aspects de la bioinformatique se prêtant particulièrement bien aux techniques de solution par contraintes. Les travaux dirigés traiteront les points suivants:
  1. Quelques notions de biologie: séquence, structure, fonction
  2. Bilan des différents problèmes, ceci inclue: génome et carte physique, transcription, expression, propriétés du language ADN, alignement (séquence, structure), enchâssement des protéines, assemblage des ligands, voies métaboliques, design de protéines, prédiction des structures, modèles d'évolution:
  3. Techniques informatiques: représentation et visualisation des informations biologiques, design des banques de données pour les ressources biologiques, minage des données, recherche et découverte de motifs (modèles), arbre phylogéniques, agglomérats.

CONTENU

1. Introduction

(i) Définition de la bioinformatique résoudre les problèmes surgissant de la biologie en utilisant les méthodes informatiques

(ii) Découpage des séquences d'ADN à partir du matériel génétique, les annotations, le contrôle de l'expression des gènes (transcription des protéines à partir de l'ADN), la relation entre la séquence d'acides aminés des protéines et sa structure.

(iii) L'importance des données: base de données biologiques (séquence, structure, expression, réseaux biochimiques), design et implémentation des algorithmes pour l'exploitation de ces données.

2. Notions de biologie:

(i) Gènes/ADN, protéines: codant via l AND, expression, interaction mutuelle, structure et fonction, voies métaboliques et réseaux régulatoires.

(ii) Dogme central: l'information portée par l'ADN est transcrit via l'ARN. C'est cette transcription qui détermine la séquence d'acides aminés constituant la protéine ainsi que sa structure (sa forme) et de là sa fonction.

(iii) Le saint Graal: développer des méthodes informatiques afin de déterminer la relation séquence d'acides aminés, structure, fonction de la protéine.

3. Classification des problèmes actuels en bioinformatique Problèmes liés au:

(i) Dogme central: séquence, structure et fonction

(ii) Données: extraction, analyse et abstraction. Minage des données, design de bases de données. Représentation/visualisation des informations biologiques.

(iii) Simulation des processus biologiques: plissage de la protéine (dynamiques moléculaires), comparaison des virus, voies métaboliques.

4. Approfondissement des problèmes actuels

(i) Comparaison et alignement des séquences ou des structures afin de déterminer l'homologie des gènes (les relations d'évolution). Correspondance des chaînes de caractères, comparaison des graphes, mélange des deux.

(ii) Recherche et découverte des motifs dans les bases de données sur les génomes, protéines, expressions et voies métaboliques/réseaux régulatoires (grosses bases de données, données parasitaires). Approches stochastiques incluant les modèles de Markov cachés (Hidden Markov Models), algorithmes d'apprentissage (Machine Learning). Langages de modèles.

(iii) Arbre phylogénétique et modèles d'évolution

(iv) Prédiction des structures: relations existantes entre la séquence et la structure (ARN ou protéines). Plissage de la protéine et l'inverse.

(v) Génome: génotype et carte physique, réarrangement génomique, méthode informatique pour trouver les chaînes d ADN.

(vi) Fonction biologique: enchâssement des protéines, assemblage des ligands, voies métaboliques et réseaux régulatoires.

5. Bioinformatique et contraintes

(i) Détermination des structures par RMN: trouver un sous ensemble consistant (maximal) des contraintes de distance.

(ii) Alignement et fragment de chaîne

(iii) Prédiction de la structure des protéines, enchâssement des protéines

(iv) Analyses des voies métaboliques

(v) Motifs et bases de données

6. L'avenir de la bioinformatique

7. Comment participer

8. Ressources et bibliographie en ligne.

Remerciements

Karine Yvon et Marcel Tourcotte pour la traduction.

Cette texte est basée sur une article "Bioinformatics and Constraints" par David Gilbert et Rolf Backofen.