Étiquetage en parties du discours de langues peu dotées par spécialisation des plongements lexicaux - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Étiquetage en parties du discours de langues peu dotées par spécialisation des plongements lexicaux

Résumé

Cet article présente une nouvelle méthode d'étiquetage en parties du discours adaptée aux langues peu dotées : la définition du contexte utilisé pour construire les plongements lexicaux est adaptée à la tâche, et de nouveaux vecteurs sont créés pour les mots inconnus. Les expériences menées sur le picard, le malgache et l'alsacien montrent que cette méthode améliore l'état de l'art pour ces trois langues peu dotées.
Fichier principal
Vignette du fichier
taln2018_restaure.pdf (501.41 Ko) Télécharger le fichier
restaure-poster.pdf (975.52 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Origine : Fichiers produits par l'(les) auteur(s)
Commentaire : présentation à TALN 2018
Loading...

Dates et versions

hal-01793092 , version 1 (23-05-2018)

Identifiants

  • HAL Id : hal-01793092 , version 1

Citer

Pierre Magistry, Anne-Laure Ligozat, Sophie Rosset. Étiquetage en parties du discours de langues peu dotées par spécialisation des plongements lexicaux. Conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France. ⟨hal-01793092⟩
215 Consultations
318 Téléchargements

Partager

Gmail Facebook X LinkedIn More