Corpora with Part-of-Speech Annotations for Three Regional Languages of France: Alsatian, Occitan and Picard - Laboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur Accéder directement au contenu
Communication Dans Un Congrès Année : 2018

Corpora with Part-of-Speech Annotations for Three Regional Languages of France: Alsatian, Occitan and Picard

Delphine Bernhard
Fanny Martin
Myriam Bras
  • Fonction : Auteur
  • PersonId : 1046948
Lucie Steiblé
Pascale Erhart
Nabil Hathout
Philippe Reynés
Jean Sibille
  • Fonction : Auteur
  • PersonId : 953268

Résumé

This article describes the creation of corpora with part-of-speech annotations for three regional languages of France: Alsatian, Occitan and Picard. These manual annotations were performed in the context of the RESTAURE project, whose goal is to develop resources and tools for these under-resourced French regional languages. The article presents the tagsets used in the annotation process as well as the resulting annotated corpora.
Fichier principal
Vignette du fichier
article-restaure-lrec.pdf (168.88 Ko) Télécharger le fichier
poster-restaure-lrec.pdf (284.56 Ko) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Format : Poster
Commentaire : Poster présenté à la conférence LREC 2018
Loading...

Dates et versions

hal-01704806 , version 1 (23-05-2018)

Identifiants

  • HAL Id : hal-01704806 , version 1

Citer

Delphine Bernhard, Anne-Laure Ligozat, Fanny Martin, Myriam Bras, Pierre Magistry, et al.. Corpora with Part-of-Speech Annotations for Three Regional Languages of France: Alsatian, Occitan and Picard. 11th edition of the Language Resources and Evaluation Conference, May 2018, Miyazaki, Japan. ⟨hal-01704806⟩
716 Consultations
515 Téléchargements

Partager

Gmail Facebook X LinkedIn More