Knowledge acquisition for machine learning and analysis of software quality in GitHub

  • David Fernández-Grande

Thèse de l'étudiant: Master typesMaster en sciences informatiques

Résumé

La mesure logicielle cherche à fournir une méthode fiable et répétable d’évaluation
de la qualité logicielle. Néanmoins, la quantification précise (incluant une définition
significative des seuils) de la relation entre les métriques logicielles et les attributs de qualité de plus haut niveau reste un défi. L’apprentissage automatique peut être utilisé pour renforcer notre compréhension des métriques logicielles et leur lien avec la qualité logicielle, ce qui requiert l’analyse de grandes quantités de données. Toutefois, certaines plateformes de programmation collective en ligne, telles que GitHub, ont l'avantage de rendre ces données logicielles disponibles au public (aussi bien le code source que les métadonnées). Cette étude utilise l’apprentissage automatique sur des dépôts (repositories) de GitHub afin d’évaluer leur qualité. En particulier, ce travail (i) rend public les métadonnées de 71942 dépôts de GitHub, utilisées ultérieurement pour (ii) décrire les caractéristiques de l’utilisation de GitHub et (iii) définir les critères de sélection des projets pertinents à l’analyse de la qualité logicielle. En outre, l’étude (iv) rassemble une version étendue de l’ensemble de données contenant les métriques logicielles de 3074 projets de GitHub exploitables par les techniques standard d’apprentissage automatique, (v) décrit le style de programmation dans cette plateforme et (vi) crée un modèle d’apprentissage automatique pour analyser la qualité de ces projets.
la date de réponse30 août 2018
langue originaleAnglais
L'institution diplômante
  • Universite de Namur
SuperviseurBENOIT FRENAY (Promoteur) & Benoit Vanderose (Copromoteur)

mots-clés

  • Apprentissage automatique
  • Mesure Logicielle,
  • Métriques Logicielles
  • Qualité Logicielle
  • GitHub
  • Exploration de données de projets logiciels.

Contient cette citation

Knowledge acquisition for machine learning and analysis of software quality in GitHub
Fernández-Grande, D. (Auteur). 30 août 2018

Thèse de l'étudiant: Master typesMaster en sciences informatiques