Dans le domaine du traitement automatique du langage, la reconnaissance d’entités nommées (noms de personnes, de lieux, d’organisations, etc.) est un défi intéressant. Comme c’est le cas pour l’ensemble des applications liées au traitement automatique des langues (TAL), il existe deux approches concurrentes : l’approche linguistique et l’approche statistique. L’une et l’autre présentent des avantages et des inconvénients. Ces dernières années, un grand nombre de recherches menées dans ce domaine ont visé à fusionner les bénéfices des ressources linguistiques et des modèles statistiques au sein d’une approche hybride. Ainsi, plusieurs études ont envisagé l’intégration d’informations linguistiques au sein d’un classifieur CRF, particulièrement adapté à l’extraction des entités nommées. Dans ce mémoire, nous évaluons différentes stratégies d’intégration de ressources linguistiques (dictionnaires à large couverture, grammaires lexico-syntaxiques, . . . ). Cette évaluation systématique nous permet de définir une méthodologie optimale, et d’ainsi proposer un extracteur compétitif.
la date de réponse | 3 sept. 2013 |
---|
langue originale | Français |
---|
L'institution diplômante | |
---|
Superviseur | Pierre Yves Schobbens (Promoteur) |
---|
Vers un classifieur hybride: Évaluation de différentes stratégies d’intégration de ressources linguistiques au sein d'un modèle CRF
Eryilmaz, S. (Auteur). 3 sept. 2013
Student thesis: Master types › Master en sciences informatiques