Knowledge acquisition for machine learning and analysis of software quality in GitHub

David Fernández-Grande

Research Center on Information Systems Engineering

Student thesis: Master types › Master en sciences informatiques

Résumé

La mesure logicielle cherche à fournir une méthode fiable et répétable d’évaluation
de la qualité logicielle. Néanmoins, la quantification précise (incluant une définition
significative des seuils) de la relation entre les métriques logicielles et les attributs de qualité de plus haut niveau reste un défi. L’apprentissage automatique peut être utilisé pour renforcer notre compréhension des métriques logicielles et leur lien avec la qualité logicielle, ce qui requiert l’analyse de grandes quantités de données. Toutefois, certaines plateformes de programmation collective en ligne, telles que GitHub, ont l'avantage de rendre ces données logicielles disponibles au public (aussi bien le code source que les métadonnées). Cette étude utilise l’apprentissage automatique sur des dépôts (repositories) de GitHub afin d’évaluer leur qualité. En particulier, ce travail (i) rend public les métadonnées de 71942 dépôts de GitHub, utilisées ultérieurement pour (ii) décrire les caractéristiques de l’utilisation de GitHub et (iii) définir les critères de sélection des projets pertinents à l’analyse de la qualité logicielle. En outre, l’étude (iv) rassemble une version étendue de l’ensemble de données contenant les métriques logicielles de 3074 projets de GitHub exploitables par les techniques standard d’apprentissage automatique, (v) décrit le style de programmation dans cette plateforme et (vi) crée un modèle d’apprentissage automatique pour analyser la qualité de ces projets.

la date de réponse	30 août 2018
langue originale	Anglais
L'institution diplômante	Universite de Namur
Superviseur	Benoît Frénay (Promoteur) & Benoit Vanderose (Copromoteur)

mots-clés

Apprentissage automatique
Mesure Logicielle,
Métriques Logicielles
Qualité Logicielle
GitHub
Exploration de données de projets logiciels.

Contient cette citation

Les documents

FernandezGrandeDavid_2018_Memoire
Fichier: application/pdf, 1,62 MB
Type: Thèse