Apprentissage discriminant de modèles neuronaux pour la traduction automatique
Résumé
Les méthodes utilisées pour entraîner des réseaux de neurones
en traitement des langues reposent, pour la plupart, sur
l'optimisation de critères qui sont décorrélés de l'application
finale. Nous proposons un nouveau cadre d'apprentissage discriminant pour l'estimation des
modèles neuronaux en traduction automatique. Ce cadre s'appuie
sur la définition d'un critère d'apprentissage qui prend
en compte, d'une part, la métrique utilisée pour l'évaluation
automatique de la traduction et, d'autre part, le processus d'intégration de ces
modèles au sein des systèmes de traduction automatique. Cette
méthode est comparée aux critères d'apprentissage usuels que sont
le maximum de vraisemblance et l'estimation contrastive bruitée.
Les expériences menées sur les tâches de traduction des séminaires
Tedtalks et de textes médicaux, depuis l'anglais vers le
français, montrent la pertinence d'un cadre d'apprentissage
discriminant et l'importance d'une initialisation judicieuse, en
particulier dans une perspective d'adaptation au domaine.
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...