Détection de codes sources fonctionnellement similaires

  • Masia Munsi

Student thesis: Master typesMaster en sciences informatiques

Résumé

Dans le domaine du génie logiciel, la recherche de codes similaires est une tache incontournable. Elle s'effectue entre autres lors d'opérations de factorisation de codes, lors d'analyse d'impact, lors de l'identification de portions de codes qui ont été plagiés. Dans des cas d'écolage, on y a recours pour la compréhension ou pour le développement de fonctionnalités.
Les approches traditionnelles pour la détection de clones logiciels permettent d'identifier des clones de type textuel, syntaxique, structurel et métrologique, mais elles sont peu adaptées pour la détection des clones sémantiques.
Récemment, de nouvelles approches basées sur l'apprentissage automatique ont été proposées dans la littérature.
Ce mémoire commence par exposer les approches classiques de recherche de clones logiciels. Puis propose une implémentation basée sur le plongement lexical.
Cette implémentation est réalisée à l'aide d'un réseau de neurones et s'appuie sur un vaste jeu de données. Son objectif est de pouvoir détecter des codes sources Python sémantiquement similaires.
la date de réponse3 sept. 2019
langue originaleFrançais
L'institution diplômante
  • Universite de Namur
SuperviseurBenoît Frénay (Promoteur) & Benoit Vanderose (Copromoteur)

mots-clés

  • Clone logiciel
  • Similarité sémantique
  • Plongement lexical
  • Apprentissage automatique
  • Apprentissage non supervisé
  • réseau de neurones

Contient cette citation

'