CONTRASTE - Pour une exploitation des données du Corpus de Langue des signes de Belgique francophone (LSFB)

Projet: Recherche

Détails du projet

Description

De plus en plus de langues des signes sont aujourd’hui documentées par
de larges corpus semblables au Corpus LSFB, c’est-à-dire qui comprennent
un gros volume d’enregistrements vidéos de signeurs en interaction, les
métadonnées documentant les tâches, les locuteurs et les fichiers vidéos,
ainsi que, pour une partie des données, l’identification des signes, un à un,
par des gloses alignées sur la vidéo.
L’exploitation de ces données est totalement dépendante du travail
préalable de l’annotation manuelle, depuis l’identification signe par signe
des vidéos (identification lexicale) jusqu’aux annotations de type analytique
(annotations discursives, syntaxiques, morphologiques, phonologiques). Le
temps et les coûts exigés par ce travail d’annotation constituent un frein à
l’exploitation des données et au développement de la linguistique des
langues signées en général. De manière pressante, les linguistes cherchent
de nouvelles méthodes pour détecter rapidement les données les plus
intéressantes au sein de leurs corpus ; le 7e et dernier Workshop on the
Representation and Processing of Sign Languages (au sein de la 10e
édition de LREC, 23-28 mai 2016) avait précisément pour intitulé Corpus
mining.
Le projet de recherche présenté ici vise à exploiter la dimension bilingue
des corpus de langue des signes (dont le Corpus LSFB) dans un triple
objectif : 1° développer une méthodologie de détection de phénomènes
spécifiques aux langues signées par le détour de leur traduction ; 2° fournir
aux enseignants, aux apprenants, aux interprètes et aux traducteurs des
ressources linguistiques servant de support à leur enseignement/acquisition
du français, de la LSFB et/ou renforçant leur compétence de bilingue ; et 3°
offrir un support automatisé au processus d’annotation.
statutFini
Les dates de début/date réelle1/01/1731/12/19

Empreinte digitale

Explorez les thèmes de recherche abordés par ce projet. Ces libellés sont générés sur la base des prix/subventions sous-jacents. Ensemble, ils forment une empreinte digitale unique.