Session Orale O4

  • Titre : Traitement automatique de la parole
  • Président : Yannick Estève
  • Date : Mardi 17/11 de 13h20 à 15h05

Article 102

  • Titre : Traduction automatique de la parole arabe/anglais par segmentations multiples
  • Fethi Bougares (Laboratoire d'Informatique de Grenoble)
  • Résumé : La traduction de la parole est un thème de recherche récent, car il combine deux problèmes scientifiques complexes : la reconnaissance de la parole et la traduction automatique. Dans ce contexte, nous nous intéressons à la construction de système de traduction statistique pour la paire de langues arabe/anglais. Ces deux langues sont de structures éloignées, ce qui nécessite plus d'effort de préparation et de segmentation des données textuelles ou orales à traduire. Après avoir mis en lumière la relation entre l'analyse morphologique de l'arabe et la qualité de traduction, nous abordons les problèmes relatifs à l'ambiguïté segmentale de l'arabe avec la formulation et l'intégration de la multi-segmentation dans un système de traduction statistique.
  • Voir l'article entier

Article 172

  • Titre : Architecture d’un Système de Vérification Automatique du Locuteur appuyée par la Détection du Genre
  • Hayet Djellali (Université de Badji Mokhtar Annaba, Algérie)
  • Radia Amirouche (Université de Badji Mokhtar Annaba, Algérie)
  • Mohamed Tayeb Laskri (Universite de badji mokhtar Annaba, Algérie)
  • Résumé : We propose a new approach in Automatic speaker verification ASV based on detection Gender (male,female). We determine with speaker voice his gender. Knowing that, the speaker could be an impostor with opposite gender that he claims. The aim of this work is to experiment if detection gender module can improve speaker verification decision when we compare it with baseline ASV system.
  • Voir l'article entier

Article 212

  • Titre : Corrections spécifiques du français sur les systèmes de reconnaissance automatique de la parole
  • Richard Dufour (LIUM - Université du Maine)
  • Yannick Estève (LIUM - Université du Maine)
  • Paul Deléglise (LIUM - Université du Maine)
  • Résumé : Automatic speech recognition (ASR) systems are used in a large number of applications, in spite of the inevitable recognition errors. In this study we propose a pragmatic approach to automatically repair ASR outputs by taking into account linguistic and acoustic information, using formal rules or stochastic methods. The proposed strategy consists in developing a specific correction solution for each specific kind of errors. In this paper, we apply this strategy on two case studies specific to French language. We show that it is possible, on automatic transcriptions of French broadcast news, to decrease the error rate of a specific error by 11.4% in one of two the case studies, and 86.4% in the other one. These results are encouraging and show the interest of developing more specific solutions to cover a wider set of errors in a future work.
  • Voir l'article entier

Article 272

  • Titre : Modélisation Stochastique du Dialogue par Structures Sémantiques
  • Florian Pinault (CERI-LIA)
  • Résumé : Dans le domaine de l'interaction Homme-Machine, les systèmes de dialogue à initiative mixte sont actuellement étudiés, afin de permettre aux utilisateurs de parler librement avec la machine. Cependant, les système de dialogue en langue naturelle manque souvent de la robustesse nécessaire pour assurer la satisfaction de l'utilisateur. Une solution consiste à utiliser une représentation sémantique riche du dialogue, ainsi qu'une modélisation statistique du cours du dialogue.
  • Voir l'article entier

Article 62

  • Titre : Vers des Modèles Autonomes de Reconnaissance Automatique de la Parole Multilingue
  • Sethserey Sam (Laboratoire d'Informatique de Grenoble (LIG))
  • Résumé : In multilingual automatic speech recognition, one interesting research challenge is how to deal with a multilingual speech utterance (the utterance that contains different speech languages and/or native or non-native speech)? In order to overcome this problem, we focus our research on autonomous acoustic models (AM) and language models (LM). Autonomous means the multilingual AM and LM are automatically re-adapted themselves, in every given time slot (5s or 10s), before final decoding. The re-adaptation of AM and ML models could be done based on a module called Autonomous observer. In this article, we introduce the concept of autonomous AM and ML in multilingual ASR system (for automatic phone transcription purpose) and also the techniques to create an observer module
  • Voir l'article entier