Qu’est-ce que la bio-informatique?

La bio-informatique est une science à l’interface des disciplines numériques (l’informatique et les mathématiques) et des sciences de la vie (biochimie, biologie, microbiologie, écologie, épidémiologie). Étant donné que les scientifiques de la vie génèrent une quantité croissante de nouvelles données portant sur les génomes, les biomolécules, les organismes, leurs interactions et leur évolution, il y a un besoin croissant d’approches informatiques pour la manipulation, le stockage, la visualisation et l’analyse de ces données souvent très complexes.

Également, la bio-informatique joue un rôle important pour la recherche biomédicale. Les travaux sur les maladies génétiques et la génomique médicale sont en pleine croissance et l’avenir d’une médecine personnalisée dépend des approches de la bio-informatique. Par conséquent, les perspectives pour trouver un emploi sont excellentes pour les bio-informaticiens.

Définition

« Domaine interdisciplinaire, situé au carrefour de l’informatique, des mathématiques et de la biologie, qui traite de l’application de l’informatique aux sciences biologiques.

Domaine jeune en effervescence, novateur, hybride et dynamique!!

La bio-informatique est un vaste domaine qui recouvre l’ensemble des utilisations de l’informatique pour la gestion, l’entreposage, l’analyse, le traitement, l’organisation, la comparaison et la diffusion de données relatives à l’ensemble des sciences biologiques (physiologie, écologie, biochimie, biologie moléculaire et, dans une large mesure génétique et génomique). »(OLF, 2001)

Historique

Des origines à 2001…

Le fondateur de la recherche bio-informatique à l’UdeM a été Robert J. Cedergren, professeur au Département de biochimie de 1966-1999. Il a incité des informaticiens, des mathématiciens, des chimistes et des physiciens à le rejoindre dans l’exploration de la structure des ARNs et de l’évolution, mouvement qui a abouti à la publication dans la revue Nature, en 1976, d’un article portant sur l’origine évolutionnaire du RNA ribosomal 5.8S. Le coauteur était David Sankoff du Centre de recherches mathématiques (UdeM). Le travail pionnier du Dr Cedergren a mené à une expansion continue de la recherche interdisciplinaire avec la collaboration de David Sankoff et Guy Lapalme (UdeM, DIRO). Au fil des 25 dernières années, D. Sankoff, maintenant à l’Université d’Ottawa, est devenu un des bio-informaticiens les plus reconnus. Aidé de Cedergren et Lapalme, il a supervisé de nombreux étudiants, en ce qui était au commencement le domaine exotique de la bio-informatique. Parmi ses étudiants et chercheurs qui poursuivent la recherche dans ce domaine, se trouvent Serguei Chteinberg (UdeM, Département de biochimie), F. Major, N. El-Mabrouk (UdeM, DIRO), D. Bryant, M. Hallett (Western U.) et beaucoup d’autres.

Différentes unités de recherches ont contribué aux recherches en bio-informatique à l’UdeM, soit:

La contribution du Département de biochimie et médecine moléculaire

Le Département de biochimie a continuellement étendu la recherche dans les domaines de la génomique comparative, structurale et fonctionnelle et a simultanement consolidé la recherche bio-informatique appliquée à ces domaines. En 1986, B. Franz Lang rejoint le Département de biochimie, augmentant ainsi l’importance donnée à la recherche phylogénétique et génomique.

En 1989, arrive Gertraud Burger, comptant parmi ses intérêts de recherche les eucaryotes primitifs (protistes). Avec la création d’une collaboration interdisciplinaire dans la génomique d’organelle de protistes (OGMP) par Cedergren, Lang, Burger (Département de biochimie et médecine moléculaire, UdeM), Sankoff, Golding (McMaster University, Hamilton), Gray (Dalhousie University, Halifax), Lemieux et Turmel (Université Laval, Ville de Québec), avec les laboratoires centraux du département de biochimie de l’UdeM, l’Université de Montréal a d’autant plus accrû la présence de la bio-informatique. Ces chercheurs sont tous affiliés avec le « Canadian Institute for Advanced Research Program in Evolutionary Biology » (CIFAR). Ce groupe est engagé dans les questions les plus fondamentales: les origines de la cellule vivante et la manière avec laquelle la vie a évolué pour mener à la forme qu’elle a aujourd’hui.

Serguei Chteinberg a été initialement un étudiant au post-doctorat et, par la suite, un assistant de R. Cedergren pendant quelques années. A partir de 1998, il est devenu chercheur au Département de biochimie et médecine moléculaire. Sa recherche est centrée sur la prédiction de la structure secondaire et les interactions moléculaires de l’ARN, au niveau de la modélisation mais aussi au niveau de la prédiction structurale.

Stephen Michnick (Département de biochimie et médecine moléculaire, UdeM) est arrivé à l’UdeM en 1995. Sa recherche comble l’écart entre le génome et la fonction. Son groupe de recherche développe des outils expérimentaux et informatiques afin de définir la fonction des gènes et leur organisation dans le but de reproduire les nombreux procédés structuraux et biochimiques de la cellule. Afin d’élargir davantage la recherche en bio-informatique à l’UdeM, le Département de biochimie et médecine moléculaire recrute Hervé Philippe (Paris, France) qui a reçu en septembre 2002, la Chaire de recherche du Canada en bio-informatique et génomique évolutive.

La contribution du Département d’ informatique et de recherche opérationnelle

Le Département d’informatique et de recherche opérationnelle à l’UdeM (DIRO) a débuté ses activités en bio-informatique, en embauchant François Major (1994) qui travaille à la modélisation tridimensionnelle de la structure des petites molécules d’ARN.

En 1998, Nadia El-Mabrouk accepte un poste au DIRO. Elle s’intéresse au développement de méthodes de parcimonie pour la comparaison de l’ordre des gènes et la reconstruction phylogénétique basée sur les réarrangements génomiques, mais crée aussi des procédures pour l’identification de motifs structurés des molécules biologiques.

En 2001, Miklos Csürös rejoint le DIRO. Ses intérêts résident dans la reconstruction des arbres évolutifs, dans les problèmes algorithmiques associés avec l’utilisation de table de clonage et l’application des algorithmes de machine d’apprentissage à l’expression des gènes et aux données génotypiques.

La contribution du Département de biologie

Le Département de Sciences biologiques de l’UdeM est aussi actif dans le domaine de la bio-informatique. François-Joseph Lapointe développe et compare les méthodes statistiques pour la validation et combinaison des arbres phylogénétiques. Récemment, sa recherche s’est centrée sur les méthodes phylogénétiques permettant le transfert latéral des gènes et plusieurs autres événements de réticulation.

Pierre Legendre est reconnu pour sa contribution à la recherche en écologie numérique, pour laquelle il a reçu plusieurs prix canadiens et internationaux. Il est l’auteur du manuel fondamental de ce nouveau domaine, et d’à peu près 150 articles scientifiques sur l’écologie quantitative et phylogénétique. Les chercheurs de son laboratoire développent des méthodes statistiques pour l’analyse de données phylogénétiques et distribuent les programmes qui les implantent.

Anne Bruneau a rejoint le Département de sciences biologiques en 1995 et elle fait de la recherche à l’Institut de recherche en Biologie Végétale. Elle s’intéresse aux mécanismes systématiques et évolutionnaires des plantes, principalement à travers l’étude des phylogénies moléculaires. Elle s’intéresse aussi à la théorie des cladistiques et aux méthodes permettant la comparaison des données moléculaires et morphologiques.

La contribution du Département de pédiatrie

Damian Labuda et Daniel Sinnett, de Pédiatrie, UdeM, collaborent depuis 1995. Ils manifestent tous deux un grand intérêt pour l’épidémiologie génétique et dans les études de génétique des populations, particulièrement dans les interactions gène-gène et gène-environnement dans l’étiologie de maladies complexes. Ils développent des outils de bio-informatique pour l’analyse génétique formelle et la gestion de base de données.

La contribution du Département de santé environnementale et de santé au travail et du Département de mathématiques

Gaétan Carrier (Département de santé environnementale et de santé au travail, UdeM) et Robert Brunet (Département de mathématiques, UdeM) collaborent depuis 1993. En combinant des expertises de médecine, de toxicologie, de mathématique et de génie, ces deux chercheurs développent de nouvelles approches à la modélisation toxico-kinétique.

Un regard vers l'avenir

Nous sommes entrés dans une ère de progrès sans précédent dans les sciences biologiques et biomédicales. Les rapports récents concernant le décryptage du génome humain ont mis en relief les vastes opportunités maintenant offertes afin d’identifier et de caractériser les gènes et leur environnement.

Outre le génome humain, les génomes de la drosophile, du ver plat, de l’arabette (Arabidopsis thaliana), de la levure et d’autres eucaryotes unicellulaires, de nombreuses bactéries, archéobactéries et virus, de mitochondries et de chloroplastes qui font partie de la cellule eukaryotique, ont été entièrement séquencés.

Puisque la majorité des gènes qui participent aux processus des cellules humaines sont aussi présents chez les organismes eucaryotes unicellulaires, nous pouvons en apprendre beaucoup sur le fonctionnement de nos cellules en les comparant à ces systèmes. Ceci comprend l’étude de l’expression des gènes, des interactions protéines-protéines et de l’ablation des gènes (ou « knock-out »).

* Comment peut-on analyser les données complexes provenant de la totalité du génome et les interpréter en termes de fonctions biologiques?

* Que doit-on savoir afin de concevoir de telles expériences d’une manière rationnelle?

La réponse réside dans cette discipline émergente qu’est la bio-informatique. Ainsi, les bio-informaticiens auront une opportunité unique dans l’histoire. A l’instar des physiciens théoriciens du vingtième siècle, les bio-informaticiens contribueront au développement de nouvelles connaissances et habiletés élémentaires en biologie, mathématique et informatique. Ainsi, ils tenteront d’établir les théories de l’organisation biochimique de la cellule jusqu’aux dynamiques des processus évolutionnaires qui ont mené à la vie telle qu’on la connaît aujourd’hui.

Problèmes abordés

Les questions fondamentales impliquent l’extraction d’informations significatives à partir d’un énorme ensemble de données. Par exemple, des outils de bio-informatique spécialisés nous permettent de reconstruire l’histoire de l’évolution et les tendances qui ont façonné les génomes d’aujourd’hui grâce à un vaste échantillon de données de séquences génomiques. De même, la structure bidimensionnelle des molécules d’ARN peut être prédite et des données épidémologiques permettent, une fois organisées d’une manière structurée, des analyses systématiques de cause à effet.

Les questions biologiques peuvent être abordées de deux façons: en étudiant comment les choses fonctionnent aujourd’hui, mais aussi en se demandant comment ces dernières ont évolué. C’est la comparaison des interactions dans les réseaux de gènes, leur fonctionnement et l’évolution de leurs fonctions qui nous permettent d’acquérir les connaissances nécessaires à la compréhension du fonctionnement d’organismes entiers.

La bio-informatique peut aussi aborder des questions plus générales. Par exemple, est-ce qu’il existe un ordre dans la vie? C’est-à-dire, est-ce qu’il existe des principes définis et efficaces de mécanismes biologiques, ou bien si les cellules vivantes sont des appareils du type «Rube Goldberg», c’est-à-dire les machines les plus compliquées possibles pour accomplir des tâches simples? Nos connaissances d’aujourd’hui suggèrent plutôt le second choix que le premier. Les réseaux biochimiques (par exemple, les voies chimiotactiques de signalisation cellulaire) sembleraient avoir été créés une fois et après diversifiés pour accomplir de nouvelles fonctions. Ces réseaux sont robustes sur une courte échelle de temps, mais variables sur une échelle de temps évolutionnaire. De plus, la sélection évolutionnaire de traits favorables semblerait se manifester par des cycles de sélection répétés. Des exemples d’un tel comportement comprennent le repliement de protéines, l’assemblage de la machinerie de ségrégation des chromosomes, la chimiotaxie, les systèmes nerveux et la spécificité des organismes.

Activités de recherche

L’Université de Montréal (UdeM) est bien connue dans le domaine de la bio-informatique. Depuis plus de deux décennies, elle offre un environnement unique à la recherche et à l’enseignement en bio-informatique. Ceci, bien avant l’arrivée de l’ère actuelle de la génomique.

Afin de marquer l’importance accordée à la recherche en bio-informatique et en génomique, l’Université de Montréal a inauguré en janvier 2004 le Centre Robert-Cedergren.

Recherches actuelles

Les recherches actuelles à l’UdeM se fondent sur :

  • Bio-informatique appliquée : Utilisation de logiciels pour l’acquisition, l’organisation, le traitement et l’analyse des données biologiques
  • Bio-informatique médicale : Génétique et génomique médicale, diagnostic de maladies, médecine personnalisée
  • Génie bio-informatique : Développement de logiciels fondés sur des algorithmes établis
  • Bio-informatique théorique : Développement d’algorithmes et de procédés qui décrivent le cadre logique de solutions à des problèmes biologiques particuliers