Etude comparative d'une méthode de détermination du nombre de classes pour des données quantitatives: la Gap Statistic

  • Sébastien Cosme

    Student thesis: Master typesMaster en sciences mathématiques

    Résumé

    Le but de ce mémoire est d'étudier une méthode récente de détermination du nombre de classes pour des données quantitatives classiques : la méthode de la Gap Statistic. Il s'agira de justifier théoriquement cette méthode, puis de l'étendre aux jeux de données caractérisés par des variables symboliques dites "intervalles". \\ L'idée de la méthode est de comparer les variations des inerties intra-classes du jeu de données original à celles d'un jeu de donnés généré selon une distribution dite "nulle". \\ Ce mémoire contient de nombreux exemples. Sur chacune des applications, le résultat de la méthode en question est évalué; elle est ainsi comparée à différentes autres méthodes bien connues dans la littérature.
    la date de réponse2007
    langue originaleFrançais
    SuperviseurAndre Hardy (Promoteur), Jean Paul Rasson (Jury) & Marcel Remon (Jury)

    mots-clés

    • Gap Statistic
    • determination of the number of clusters
    • "interval" features
    • within cluster dispersion
    • null reference distribution

    Contient cette citation

    '