Construction d'arbres de décision adaptée aux attributs quantitatifs et à l'asymétrie

  • Arnaud Elias

    Student thesis: Master typesMaster en sciences informatiques

    Résumé

    En data mining, la classification supervisée permet, après une phase d’apprentissage d’un modèle à partir d’un jeu de données, d’appliquer ce modèle à de nouveaux jeux de données de structure identique au premier. Dans ce travail, nous nous sommes penchés sur deux spécificités du jeu de données qui peuvent complexifier la tâche d’apprentissage et donner lieu à de faibles performances de classification : l’asymétrie des données et les attributs indépendants quantitatifs.
    Dans le but d’améliorer les performances de classification sur ce type de données, nous avons construit un classifieur utilisant plusieurs techniques connues pour leur adéquation par rapport à ces deux spécificités. Notre solution est basée sur un algorithme de création d’arbres de décision et possède plusieurs instances, chacune ayant des propriétés particulières.
    Afin d’être en mesure de qualifier notre solution, nous évaluons et comparons les résultats obtenus par les différentes instances sur plusieurs jeux de données possédant ces spécificités.
    la date de réponse2011
    langue originaleFrançais
    L'institution diplômante
    • Universite de Namur
    SuperviseurWim Vanhoof (Promoteur)

    mots-clés

    • data mining
    • jeux de données asymétriques
    • arbres de décision
    • règles
    • classification
    • discrétisation
    • attributs quantitatifs
    • classe minoritaire

    Contient cette citation

    '