Unsupervised Mining of Knowledge Gaps in Scientific Literature

Résumé : La découverte au travers de la littérature (Literature Based Discovery ou LBD) repose sur l'identification des lacunes dans la littérature scientifique. La plupart des méthodes existantes sont supervisées et s'appuient sur l'utilisation de larges bases de connaissances spécifiques telles que MEDLINE dans le domaine de la médecine. Dans cet article, nous présentons une approche fondée sur des techniques de Traitement de la Langue Naturelle (TALN), d'exploration de treillis de concepts formels et sur une utilisation minimale de ressources linguistiques. Les entités sont extraites automatiquement à partir du texte intégral des articles scientifiques en fonction de leurs acronymes. Une classification non supervisée est construite en utilisant la syntaxe et les relations de WordNet. Les classes résultantes sont regroupées en plusieurs concepts formels et les lacunes de connaissances sont définies dans le treillis de Galois induit. La faisabilité et la pertinence des résultats sont analysées sur un large corpus textuel d'articles de revues portant sur la recherche en énergie nucléaire.
Type de document :
Communication dans un congrès
Liste complète des métadonnées

Littérature citée [10 références]  Voir  Masquer  Télécharger

https://hal-univ-avignon.archives-ouvertes.fr/hal-02152783
Contributeur : Pierre Jourlin <>
Soumis le : mardi 11 juin 2019 - 16:46:08
Dernière modification le : mardi 18 juin 2019 - 01:24:18

Fichier

jadt2010_final.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : hal-02152783, version 1

Collections

Citation

Silvia Fernandez¹, Pierre Jourlin, Eric Sanjuan². Unsupervised Mining of Knowledge Gaps in Scientific Literature. Journées d’Analyse statistique des Données Textuelles, Jun 2010, Rome, Italy. ⟨hal-02152783⟩

Partager

Métriques

Consultations de la notice

4

Téléchargements de fichiers

6