Vers un classifieur hybride
: Évaluation de différentes stratégies d’intégration de ressources linguistiques au sein d'un modèle CRF

Serkan Eryilmaz

Faculte d'informatique

Student thesis: Master types › Master en sciences informatiques

Résumé

Dans le domaine du traitement automatique du langage, la reconnaissance d’entités nommées (noms de personnes, de lieux, d’organisations, etc.) est un défi intéressant. Comme c’est le cas pour l’ensemble des applications liées au traitement automatique des langues (TAL), il existe deux approches concurrentes : l’approche linguistique et l’approche statistique. L’une et l’autre présentent des avantages et des inconvénients. Ces dernières années, un grand nombre de recherches menées dans ce domaine ont visé à fusionner les bénéfices des ressources linguistiques et des modèles statistiques au sein d’une approche hybride. Ainsi, plusieurs études ont envisagé l’intégration d’informations linguistiques au sein d’un classifieur CRF, particulièrement adapté à l’extraction des entités nommées. Dans ce mémoire, nous évaluons différentes stratégies d’intégration de ressources linguistiques (dictionnaires à large couverture, grammaires lexico-syntaxiques, . . . ). Cette évaluation systématique nous permet de définir une méthodologie optimale, et d’ainsi proposer un extracteur compétitif.

la date de réponse	3 sept. 2013
langue originale	Français
L'institution diplômante	Universite de Namur
Superviseur	Pierre Yves Schobbens (Promoteur)

Contient cette citation

Les documents

2013_EryilmazS_memoire
Fichier: application/pdf, 906 KB
Type: Thèse

Vers un classifieur hybride: Évaluation de différentes stratégies d’intégration de ressources linguistiques au sein d'un modèle CRF

Résumé

Contient cette citation

Les documents

Vers un classifieur hybride
: Évaluation de différentes stratégies d’intégration de ressources linguistiques au sein d'un modèle CRF