A comparative study of word embeddings and other features for lexical complexity detection in French - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

A comparative study of word embeddings and other features for lexical complexity detection in French

Etude comparative de plongements lexicaux et autres traits pour la détection de la complexité lexicale en français

Résumé

Lexical complexity detection is an important step for automatic text simplification which serves to make informed lexical substitutions. In this study, we experiment with word embeddings for measuring the complexity of French words and combine them with other features that have been shown to be well-suited for complexity prediction. Our results on a synonym ranking task show that embeddings perform better than other features in isolation, but do not outperform frequency-based systems in this language.
Détecter la complexité lexicale est une étape importante pour la simplification automatique de textes, servant lors de l'identification des éléments lexicaux à substituer. Dans ce travail, nous explorons l'utilité des plongements lexicaux pour mesurer la complexité de mots en français, en les combinant avec d'autres traits reconnus comme étant utiles pour cette tâche. Nos résultats sur une tâche d'ordonnancement de synonymes selon leur complexité montrent que les plongements seuls donnent de meilleurs résultats que nombreux autres traits, bien que leur performance reste inférieure à celle de systèmes basés sur la fréquence pour cette langue.
Fichier principal
Vignette du fichier
taln-complexity-3.pdf (126.86 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

hal-01838512 , version 1 (13-07-2018)

Identifiants

  • HAL Id : hal-01838512 , version 1

Citer

Aina Garí, Marianna Apidianaki, Alexandre Allauzen. A comparative study of word embeddings and other features for lexical complexity detection in French. Conférence sur le Traitement Automatique des Langues Naturelles, May 2018, Rennes, France. ⟨hal-01838512⟩
88 Consultations
184 Téléchargements

Partager

Gmail Facebook X LinkedIn More