Clustering with Decision Trees: Divisive and Agglomerative Approach

  • Lauriane Castin

Student thesis: Master typesMaster en sciences informatiques

Résumé

Les arbres de décision sont des outils utilisés en Apprentissage Automatique pour réaliser des tâches de classification. Les échantillons sont soumis à un test dans chacun des noeuds et sont guidés au travers de l’arbre sur base du résultat. Les arbres de décision peuvent aussi être utilisés pour faire du clustering, à condition d’y apporter quelques adaptations:
d’un côté, de nouveaux critères de division doivent être découverts pour profiter des caractéristiques des échantillons plutôt que de leurs classes, et d’un autre côté les noeuds faisant référence aux mêmes clusters doivent être fusionnés.
Le but de ce mémoire est de proposer des solutions à ces deux aspects. Malheureusement, quand le clustering avec les arbres de décision est comparé aux technique de clustering existantes, les résultats sont décevants, avec des hauts taux de mauvaise classification sur des ensembles de données représentant des chiffres écrits à la main.
mots-clefs: Apprentissage Automatique, Arbre de Décision, Clustering, Critère de Division, Agglomération
la date de réponse29 août 2017
langue originaleAnglais
L'institution diplômante
  • Universite de Namur
SuperviseurJean-Marie Jacquet (Président) & Benoît Frénay (Promoteur)

Contient cette citation

'