(i) Définition de la bioinformatique résoudre les problèmes surgissant de la biologie en utilisant les méthodes informatiques
(ii) Découpage des séquences d'ADN à partir du matériel génétique, les annotations, le contrôle de l'expression des gènes (transcription des protéines à partir de l'ADN), la relation entre la séquence d'acides aminés des protéines et sa structure.
(iii) L'importance des données: base de données biologiques (séquence, structure, expression, réseaux biochimiques), design et implémentation des algorithmes pour l'exploitation de ces données.
(i) Gènes/ADN, protéines: codant via l AND, expression, interaction mutuelle, structure et fonction, voies métaboliques et réseaux régulatoires.
(ii) Dogme central: l'information portée par l'ADN est transcrit via l'ARN. C'est cette transcription qui détermine la séquence d'acides aminés constituant la protéine ainsi que sa structure (sa forme) et de là sa fonction.
(iii) Le saint Graal: développer des méthodes informatiques afin de déterminer la relation séquence d'acides aminés, structure, fonction de la protéine.
(i) Dogme central: séquence, structure et fonction
(ii) Données: extraction, analyse et abstraction. Minage des données, design de bases de données. Représentation/visualisation des informations biologiques.
(iii) Simulation des processus biologiques: plissage de la protéine (dynamiques moléculaires), comparaison des virus, voies métaboliques.
(i) Comparaison et alignement des séquences ou des structures afin de déterminer l'homologie des gènes (les relations d'évolution). Correspondance des chaînes de caractères, comparaison des graphes, mélange des deux.
(ii) Recherche et découverte des motifs dans les bases de données sur les génomes, protéines, expressions et voies métaboliques/réseaux régulatoires (grosses bases de données, données parasitaires). Approches stochastiques incluant les modèles de Markov cachés (Hidden Markov Models), algorithmes d'apprentissage (Machine Learning). Langages de modèles.
(iii) Arbre phylogénétique et modèles d'évolution
(iv) Prédiction des structures: relations existantes entre la séquence et la structure (ARN ou protéines). Plissage de la protéine et l'inverse.
(v) Génome: génotype et carte physique, réarrangement génomique, méthode informatique pour trouver les chaînes d ADN.
(vi) Fonction biologique: enchâssement des protéines, assemblage des ligands, voies métaboliques et réseaux régulatoires.
(i) Détermination des structures par RMN: trouver un sous ensemble consistant (maximal) des contraintes de distance.
(ii) Alignement et fragment de chaîne
(iii) Prédiction de la structure des protéines, enchâssement des protéines
(iv) Analyses des voies métaboliques
(v) Motifs et bases de données
Karine Yvon et Marcel Tourcotte pour la traduction.
Cette texte est basée sur une article "Bioinformatics and Constraints" par David Gilbert et Rolf Backofen.