Vers un classifieur hybride
: Évaluation de différentes stratégies d’intégration de ressources linguistiques au sein d'un modèle CRF

  • Serkan Eryilmaz

Thèse de l'étudiant: Master typesMaster en sciences informatiques

Résumé

Dans le domaine du traitement automatique du langage, la reconnaissance d’entités nommées (noms de personnes, de lieux, d’organisations, etc.) est un défi intéressant. Comme c’est le cas pour l’ensemble des applications liées au traitement automatique des langues (TAL), il existe deux approches concurrentes : l’approche linguistique et l’approche statistique. L’une et l’autre présentent des avantages et des inconvénients. Ces dernières années, un grand nombre de recherches menées dans ce domaine ont visé à fusionner les bénéfices des ressources linguistiques et des modèles statistiques au sein d’une approche hybride. Ainsi, plusieurs études ont envisagé l’intégration d’informations linguistiques au sein d’un classifieur CRF, particulièrement adapté à l’extraction des entités nommées. Dans ce mémoire, nous évaluons différentes stratégies d’intégration de ressources linguistiques (dictionnaires à large couverture, grammaires lexico-syntaxiques, . . . ). Cette évaluation systématique nous permet de définir une méthodologie optimale, et d’ainsi proposer un extracteur compétitif.
la date de réponse3 sept. 2013
langue originaleFrançais
L'institution diplômante
  • Universite de Namur
SuperviseurPIERRE-YVES SCHOBBENS (Promoteur)

Contient cette citation

'