Résumé
En data mining, la classification supervisée permet, après une phase d’apprentissage d’un modèle à partir d’un jeu de données, d’appliquer ce modèle à de nouveaux jeux de données de structure identique au premier. Dans ce travail, nous nous sommes penchés sur deux spécificités du jeu de données qui peuvent complexifier la tâche d’apprentissage et donner lieu à de faibles performances de classification : l’asymétrie des données et les attributs indépendants quantitatifs.Dans le but d’améliorer les performances de classification sur ce type de données, nous avons construit un classifieur utilisant plusieurs techniques connues pour leur adéquation par rapport à ces deux spécificités. Notre solution est basée sur un algorithme de création d’arbres de décision et possède plusieurs instances, chacune ayant des propriétés particulières.
Afin d’être en mesure de qualifier notre solution, nous évaluons et comparons les résultats obtenus par les différentes instances sur plusieurs jeux de données possédant ces spécificités.
la date de réponse | 2011 |
---|---|
langue originale | Français |
L'institution diplômante |
|
Superviseur | Wim Vanhoof (Promoteur) |
mots-clés
- data mining
- jeux de données asymétriques
- arbres de décision
- règles
- classification
- discrétisation
- attributs quantitatifs
- classe minoritaire