Spoken document representations for probabilistic retrieval - Avignon Université Accéder directement au contenu
Article Dans Une Revue Speech Communication Année : 2000

Spoken document representations for probabilistic retrieval

Pierre Jourlin
Sue E Johnson
  • Fonction : Auteur
Karen Spärck Jones
  • Fonction : Auteur
Philip C. Woodland
  • Fonction : Auteur

Résumé

Zusammenfassung Dieser Bericht pr asentiert einige Entwicklungen zur Fragenerweiterung and Dokumentendarstellung in unserem Spracherfassungssystem. Verschiedene Erfassungsmethoden, die auf einer Menge von Transkriptionen basieren welche von g angigen Textquellen abgeleitet werden, k onnen auf die Leistung einen Ein¯uss haben. Wir zeigen, daû Modifi-kationen an der Dokumentendarstellung in Kombination mit verschiedenen Techniken der Fragenerweiterung, die einerseits wissensbasiert und andererseits statistikbezogen sind, Durchschnittsgenauigkeitverbesserungen von mehr als 19% relativ zu einem anlichem System im Vergleich zu dem hier pr asentiertem TREC-7, ergeben. Diese neuen Expe-rimente haben ebenfalls best atigt, daû die Durchschnittsgenauigkeitdegradierung, bezogen auf die Wortfehlerrate (WER) von 25% ziemlich klein sind (3X7% relativ) und sie auf fast auf null reduziert werden k onnen (0,2% relativ). Die Gesamtverbesserungen des Spracherfassungssystems wurde auch f ur sieben verschiedene Mengen von Transkriptionen, mit Wortfehlerrate zwischen 24X8% und 61X5%, observiert. Wir hoen, diese Ergebnisse f ur gr ossere Dokumenten-sammlungen zu wiederholen, um die Skalierbarkeit dieser Techniken absch atzen zu k onnen.
This paper presents some developments in query expansion and document representation of our spoken document retrieval system and shows how various retrieval techniques affect performance for different sets of transcriptions derived from a common speech source. Modifcations of the document representation are used, which combine several techniques for query expansion, knowledge-based on one hand and statistics-based on the other. Taken together, these techniques can improve Average Precision by over 19% relative to a system similar to that which we presented at TREC-7. These new experiments have also confirmed that the degradation of Average Precision due to a word error rate (WER) of 25% is quite small (3.7% relative) and can be reduced to almost zero (0.2% relative). The overall improvement of the retrieval system can also be observed for seven different sets of transcriptions from different recognition engines with a WER ranging from 24.8% to 61.5%. We hope to repeat these experiments when larger document collections become available, in order to evaluate the scalability of these techniques.
Cet article présente quelques développements dans l'expansion de requête et la représentation des documents de notre système de recherche documentaire et montre comment les diverses techniques de recherche augmentent la performance pour différents ensembles de transcriptions dérivés d'une source de parole commune. Des modifications de la représentation des documents sont effectuées, qui combinent plusieurs techniques pour l'expansion de requête, fondées sur des connaissances d'une part et sur des statistiques d'autre part. Utilisées conjointement, ces techniques peuvent améliorer la Précision Moyenne de plus de 19%, relativement a un système semblable à celui que nous avons présenté a TREC-7. Ces nouvelles expérimentations ont également confirmé que la dégradation de la Précision Moyenne due a un Taux d'Erreur de Mot (WER) de 25% est vraiment faible (3,7% relatif) et peut être réduite a une quantité négligeable (0,2% relatif). L'amélioration globale du système de recherche documentaire peut aussi être observé pour sept ensembles différents de transcriptions provenant de différents systèmes de reconnaissance ayant un WER variant de 24,8% a 61,5%. Nous espérons reproduire ces expérimentations, lorsque de plus grandes collections de documents parlés seront disponibles, afin d'évaluer le comportement de ces techniques sur de plus gros volumes de données.
Fichier principal
Vignette du fichier
jourlin.SpeechCom00.pdf (583.39 Ko) Télécharger le fichier
Origine : Fichiers éditeurs autorisés sur une archive ouverte
Loading...

Dates et versions

hal-02152860 , version 1 (13-06-2019)

Identifiants

  • HAL Id : hal-02152860 , version 1

Citer

Pierre Jourlin, Sue E Johnson, Karen Spärck Jones, Philip C. Woodland. Spoken document representations for probabilistic retrieval. Speech Communication, 2000. ⟨hal-02152860⟩

Collections

UNIV-AVIGNON LIA
48 Consultations
243 Téléchargements

Partager

Gmail Facebook X LinkedIn More