Session Orale O3

  • Titre : Phonétique
  • Présidente : Christine Meunier
  • Date : Mardi 17/11 de 9h45 à 12h05

Article 112

  • Titre : Identification des consonnes finales du vietnamien par des locuteurs natifs
  • Thi-Thuy-Hien Tran (Département Parole et Cognition de GIPSA-lab)
  • Nathalie Vallée (Département Parole et Cognition de GIPSA-lab)
  • Résumé : A great difficulty encountered by Vietnamese subjects, who learn French, is that consonant clusters, which do not exist in Vietnamese, are mispronounced. This problem persists even after several years of practicing, and even when the French clusters correspond to Vietnamese consonant sequences. The general aim of our project is to identify the factors which are the main cause of this problem. In this paper, we examine the perception of syllable-final stops (/p/, /t/, /k/, /m/, /n/, /ŋ/) in Vietnamese by 20 native Northern-Vietnamese listeners. Our findings suggest that specific acoustic characteristics and probably the lexical frequency of final consonants lead the subjects in their choice of responses.
  • Voir l'article entier

Article 222

  • Titre : Caractérisation automatique des accents étrangers
  • Abdelkarim Mars (Laboratoire d'informatique de grenoble)
  • Résumé : Parmi les phénomènes qui affectent la manière dont nous parlons, l’accent est une des composantes principales de la variation observée. La prononciation d’un locuteur peut en effet nous renseigner sur son origine, géographique et sociale. La description des caractéristiques phonétiques qui sous-tendent les différences d’accent perçues constitue donc un intérêt scientifique particulier. De plus, la recherche dans le domaine des accents contribue a l’amélioration d’applications technologiques telles que la reconnaissance de la parole et l’indexation du locuteur. Ce papier propose une étude phonétique acoustique des accents étrangers en français. Afin d’analyser à grande échelle les variations liées a l’origine de locuteur, nous avons évalue l’apport des outils automatiques décodage acoustico-phonétique et alignement force.
  • Voir l'article entier

Article 232

  • Titre : Une Base de données Etiquetée Formantiquement en Langue Arabe Standard
  • Imen Jemaa (Unité de Recherche Traiement du Signal, Traitement de l'image et Reconnaissance de Formes, Tunisie)
  • Oussama Rekhis (Unité de Recherche Traiement du Signal, Traitement de l'image et Reconnaissance de Formes, Tunisie)
  • Kais Ouni (Unité de Recherche Traiement du Signal, Traitement de l'image et Reconnaissance de Formes, Tunisie)
  • Yves Laprie (Equipe Parole, LORIA Nancy1, France)
  • Résumé : While formant frequencies are known to play a critical role in human speech perception and in computer speech processing, there has been a lack of standard databases needed for the quantitative evaluation of automatic formant extraction techniques especially in Arabic language. We report in this paper our recent effort to create a reference database of the first three formant tracks. The manually Formant labeling is carried out used the Winsnoori tool. Furthermore, we present in this paper an exploratory use of the database to quantitatively evaluate the automatic LPC method implemented in the popular open source Praat using the hand edited formant trajectories as reference.
  • Voir l'article entier

Article 242

  • Titre : Construction d’un corpus robuste de différents dialectes arabes
  • Mohamed Belgacem (Laboratoire LIDILEM )
  • Résumé : Notre article s’intègre dans le cadre du projet intitulé 'Oréodule' : un système embarqué temps réel de reconnaissance, de traduction et de synthèse de la parole arabe. L’objet de notre intérêt dans cet article est la présentation d’un corpus vocal de la parole arabe. Nous détaillerons les étapes de constitution de ce corpus et les difficultés rencontrées lors de son élaboration. Nous intègrerons également les différents résultats pratiques obtenus lors de chaque phase (tailles des enregistrements, volume total du notre corpus, etc.).
  • Voir l'article entier

Article 92

  • Titre : Perception d’expressions multimodales du Feeling of Thinking (états mentaux et affectifs, intentions, attitudes) en interaction
  • Anne Vanpé (GIPSA-lab, Département Parole et Cognition (ex-ICP), UMR 5216 CNRS/Université de Grenoble)
  • Véronique Aubergé (GIPSA-lab, Département Parole et Cognition (ex-ICP), UMR 5216 CNRS/Université de Grenoble)
  • Résumé : Human-Machine Interaction, as interaction between two humans, can be considered as a dynamic process where the human is continuously communicating, even when he is “expressively” listening (informative backchannel and feedback). The present study analyses the audio-visual non speech expressions for two subjects in spontaneous HMI corpora, following an ethology-based methodology. First results reveal a large panel of values expressed outside of turns (e.g. mental states, intentions, attitudes, emotions) that we have globally called Feeling of Thinking. We have shown the role of static vs. dynamic processing of visual information and we are now attempting to investigate some specific non speech “vocal events”. Their temporal distribution seems to be particularly relevant for the perception of Feeling of Thinking expressions.
  • Voir l'article entier