A multi-objective genetic algorithm for biclustering of gene expression data with probabilistic encoding and overlapping control

  • Michaël Marcozzi

Thèse de l'étudiant: Master typesMaster en sciences informatiques

Résumé

Ce travail consiste dans le développement d'un programme informatique capable d'extraire des informations utiles hors de données biologiques, en utilisant une stratégie algorithmique inspirée par le modèle biologique de l'évolution des espèces. Le bipartitionnement de données d'expression de gènes consiste à analyser de grandes quantités de données d'expériences de biologie mesurant le niveau d'expression de gènes dans certaines conditions expérimentales (différents tissus, différents patients...), afin d'identifier des groupes de gènes qui présentent des comportements cohérents sous certains groupes de conditions. Cette information peut en effet se révéler particulièrement intéressante d'un point de vue biologique et médical. Les algorithmes évolutionnaires constituent une classe générique d'algorithmes, qui ont en commun l'utilisation de mécanismes inspirés par l'évolution darwinienne, afin de résoudre des problèmes d'optimisation. Les techniques d'algorithmique évolutionnaire peuvent être particulièrement bien adaptées pour réaliser un bipartitionnement efficace de données d'expression de gènes, et plusieurs approches évolutionnaires de bipartitionnement ont été proposées dans la littérature. Dans ce mémoire, nous présentons MOBPEOC, une nouvelle approche évolutionnaire de bipartitionnement que nous avons développée, afin d'améliorer le mécanisme de bipartitionnement d'une approche évolution- naire existante. En particulier, MOBPEOC représente un premier test grandeur nature pour une nouvelle technique évolutionnaire à portée générale, appelée encodage probabiliste, et que nous proposons pour la première fois dans le cadre de ce travail. Une évaluation expérimentale de l'algorithme MOPBEOC est proposée, où la technique est mise à l'épreuve sur de véritables données biologiques. La comparaison des résultats obtenus, par rapport à l'approche évolutionnaire de bipartitionnement précédente, montre une forte amélioration de la qualité des solutions découvertes.
la date de réponse29 sept. 2010
langue originaleAnglais
L'institution diplômante
  • Universite de Namur
SuperviseurWim VANHOOF (Promoteur)

Contient cette citation

A multi-objective genetic algorithm for biclustering of gene expression data with probabilistic encoding and overlapping control
Marcozzi, M. (Auteur). 29 sept. 2010

Thèse de l'étudiant: Master typesMaster en sciences informatiques