Session Orale O3

  • Titre : Extraction et gestion des connaissances
  • Président : Nicolas Faessel
  • Date : Lundi 16/11 de 15h35 à 17h30

Article 762

  • Titre : Les tables du Lexique-Grammaire au format TAL
  • Elsa Tolone (Institut Gaspard-Monge, Université Paris-Est)
  • Résumé : Dans cet article, nous présentons les tables du Lexique-Grammaire, qui constituent un lexique syntaxique très riche pour le français. Cette base de données linguistique est inexploitables informatiquement car elle est incomplète et manque de cohérence. Notre objectif est d'adapter les tables pour les rendre utilisables dans diverses applications de Traitement Automatique des Langues (TAL). Nous expliquons les problèmes rencontrés et les méthodes adoptées pour permettre de les intégrer dans un analyseur syntaxique.
  • Voir l'article entier

Article 1172

  • Titre : Exterlog : Extraction de la terminologie à partir de logs
  • Hassan Saneifar (LIRMM - Univ. Montpellier 2 - CNRS UMR 5506)
  • Résumé : Les fichiers logs issus des systèmes numériques contiennent des informations importantes concernant les conditions et les configurations du système. Dans le domaine de la conception de circuits intégrés, des fichiers logs sont produits par les outils de conception mais ne sont pas systématiquement exploités de façon optimale. Bien que ces logs soient écrits en anglais, ils ne respectent généralement pas la grammaire ou les structures du langage naturel. En outre, ils ont des structures hétérogènes et évolutives. Selon les particularités de telles données textuelles, l’application des méthodes classiques de TALN n’est pas une tâche facile, particulièrement pour extraire la terminologie. Dans cet article, nous présentons notre approche EXTERLOG qui extrait la terminologie à partir des logs. Nous étudions également si l’étiquetage grammatical de fichiers logs est une approche pertinente pour extraire la terminologie.
  • Voir l'article entier

Article 1292

  • Titre : Interrogations de moteurs de recherche par des requêtes formulées en langage naturel
  • Ludovic Bonnefoy (Centre d'Enseignement et de Recherche en Informatique d'Avignon)
  • Romain Deveaud (Centre d'Enseignement et de Recherche en Informatique d'Avignon)
  • Eric Charton (Laboratoire Informatique d'Avignon)
  • Résumé : La difficulté de la tâche d’interprétation de requêtes en langue naturelle réside dans la transformation d’une phrase grammaticale en une requête pertinente pour interroger un système de RI ou d’extraction d’information. Dans cet article, nous présentons un système d’extraction d’information associé à un analyseur de requêtes, dédié à l’analyse et à l’interprétation de questions factuelles formulées en langue naturelle issues de la campagne TREC. Notre système fournit des réponses en exploitant un système composé d’une ressource ontologique et sémantique issue d’un corpus encyclopédique, dont on aura extrait les réponses candidates à l’aide de méthodes statistiques.
  • Voir l'article entier

Article 1522

  • Titre : Détection de mots hors-vocabulaire par combinaison de mesures de confiance de haut et bas niveaux
  • Benjamin Lecouteux (Laboratoire Informatique d'Avignon)
  • Georges Linarès (Laboratoire Informatique d'Avignon)
  • Benoit Favre (ICSI Berkeley, USA)
  • Résumé : Cet article aborde le problème de la détection des mots hors-vocabulaire dans le cadre des Systèmes de Reconnaissance Automatique de la Parole (SRAP) continu grand vocabulaire. Nous proposons une méthode inspirée par les mesures de confiance, qui consiste en l'analyse des sorties du système afin d'y détecter automatiquement les erreurs liées aux mots hors-vocabulaire. Cette méthode combine différents paramètres basés sur l'acoustique, la linguistique, la topologie du graphe de décodage ainsi que sur des paramètres sémantiques. Nous évaluons séparément chacun de ces paramètres et nous estimons leur complémentarité. Les expériences ont été menées sur un corpus d'émissions radio issu de la campagne ESTER. Les résultats montrent des performances intéressantes en condition réelle : nous obtenons un taux de détection de mots hors vocabulaire de 43%-90% pour 2.5%-17.5% de fausse détection.
  • Voir l'article entier

Article 602

  • Titre : Méthodologie pour l'orchestration sémantique de services : application à la fouille de documents multimédia.
  • Jérémie Doucy (Laboratoire LITIS / EADS Defence & Security)
  • Habib Abdulrab (Laboratoire LITIS)
  • Patrick Giroux (EADS Defence & Security)
  • Jean-Philippe Kotowicz (Laboratoire LITIS)
  • Résumé : Cet article présente une nouvelle approche, basée sur les standards existants, pour la construction de chaînes de traitement dans le domaine de la fouille de documents multimédia. En utilisant le paradigme des architectures orientées services, l'approche que nous présentons ici permet de simplifier drastiquement la création de ces chaînes et ouvre une voie vers la validation et l'automatisation de processus 'métiers' complexes. Nous avons appliqué cette approche dans le domaine de la fouille de documents multimédia.
  • Voir l'article entier