Étude des principes d'interprétation sémantique tabulaire dans l'Open Data

  • Anthony Cabello
  • Romain Verhelle

Student thesis: Master typesMaster en sciences informatiques

Résumé

Ces dernières années, le monde de l’Open Data s’agrandit de jour en jour. Les bases de données ne cessent de croitre ainsi que l’intérêt pour l’annotation de tableaux sur le Web. Notre travail s’intéresse surtout aux Linked open data (LOD). C’est un système qui permet de relier différentes sources de données entre elles. Ces dernières sont libres d’accès et d’utilisation permettant à tout individu de pouvoir les utiliser. L’interprétation sémantique (STI) des tables est un processus qui exploite la sémantique des bases de connaissances (KB) afin de pouvoir annoter les colonnes, cellules et relations d’une table. Ce mémoire commence par synthétiser la définition, les méthodes et les meilleurs outils existants de cette interprétation. Il décrit ensuite le développement d’une solution qui permet d’annoter un ensemble de tableaux de manière efficiente et de les comparer entre eux grâce à DBpedia. Cette solution se base sur des outils existants. Elle comble certaines lacunes de ces derniers et amène une preuve de concept d’un procédé complet d’annotation et de comparaison de tableaux. Enfin nous discuterons des résultats, des limitations et des perspectives d’amélioration pour les travaux futurs.
la date de réponse2 sept. 2021
langue originaleFrançais
L'institution diplômante
  • Universite de Namur
SuperviseurAnthony Cleve (Promoteur)

mots-clés

  • Table Interpretation
  • STI tool
  • Dataset Matching
  • HTML Table
  • Open Data
  • Knowledge Graph
  • LOD

Contient cette citation

'