Le but de ce mémoire est d'étudier une méthode récente de détermination du nombre de classes pour des données quantitatives classiques : la méthode de la Gap Statistic. Il s'agira de justifier théoriquement cette méthode, puis de l'étendre aux jeux de données caractérisés par des variables symboliques dites "intervalles". \\
L'idée de la méthode est de comparer les variations des inerties intra-classes du jeu de données original à celles d'un jeu de donnés généré selon une distribution dite "nulle". \\
Ce mémoire contient de nombreux exemples. Sur chacune des applications, le résultat de la méthode en question est évalué; elle est ainsi comparée à différentes autres méthodes bien connues dans la littérature.
la date de réponse | 2007 |
---|
langue originale | Français |
---|
Superviseur | Andre Hardy (Promoteur), Jean Paul Rasson (Jury) & Marcel Remon (Jury) |
---|
- Gap Statistic
- determination of the number of clusters
- "interval" features
- within cluster dispersion
- null reference distribution
Etude comparative d'une méthode de détermination du nombre de classes pour des données quantitatives: la Gap Statistic
Cosme, S. (Auteur). 2007
Student thesis: Master types › Master en sciences mathématiques