Détection de codes sources fonctionnellement similaires

  • Masia Munsi

Thèse de l'étudiant: Master typesMaster en sciences informatiques

Résumé

Dans le domaine du génie logiciel, la recherche de codes similaires est une tache incontournable. Elle s'effectue entre autres lors d'opérations de factorisation de codes, lors d'analyse d'impact, lors de l'identification de portions de codes qui ont été plagiés. Dans des cas d'écolage, on y a recours pour la compréhension ou pour le développement de fonctionnalités.
Les approches traditionnelles pour la détection de clones logiciels permettent d'identifier des clones de type textuel, syntaxique, structurel et métrologique, mais elles sont peu adaptées pour la détection des clones sémantiques.
Récemment, de nouvelles approches basées sur l'apprentissage automatique ont été proposées dans la littérature.
Ce mémoire commence par exposer les approches classiques de recherche de clones logiciels. Puis propose une implémentation basée sur le plongement lexical.
Cette implémentation est réalisée à l'aide d'un réseau de neurones et s'appuie sur un vaste jeu de données. Son objectif est de pouvoir détecter des codes sources Python sémantiquement similaires.
Date de réussite3 sept. 2019
langueFrançais
Institution diplomante
  • Universite de Namur
SuperviseurBENOIT FRENAY (Promoteur) & Benoit Vanderose (Copromoteur)

mots-clés

  • Clone logiciel
  • Similarité sémantique
  • Plongement lexical
  • Apprentissage automatique
  • Apprentissage non supervisé
  • réseau de neurones

Citer ceci

Détection de codes sources fonctionnellement similaires
Munsi, M. (Auteur). 3 sept. 2019

Thèse de l'étudiant: Master typesMaster en sciences informatiques