Directory Intranet
Chargement
  

DOCVACIM - Données cinéradiographiques valorisées et recherches sur la coarticulation, l'inversion et l'évaluation de modèles physiques

Project Coordinator : LILPA Strasbourg
Project Manager at GIPSA-lab : Pascal PERRIER

Project realized thanks to the support of : ANR Thématique (Sciences Humaines et Sociales)

Start date : 2008/01/01

Duration : 48 mounths


Ce projet de recherche, en production-perception de la parole, a pour objectif général de contribuer à la compréhension et à la modélisation du contrôle des gestes de la parole, par l’analyse de la coarticulation, l’étude de l’inversion et l’évaluation de modèles physiques.

La production de la parole nécessite une coordination précise des articulateurs dans un espace  donné ; le chevauchement gestuel ou la coarticulation se fait selon des contraintes spécifiques aux sons, aux langues et aux locuteurs. Cet aspect des recherches sur l’organisation spatio-temporelle des gestes linguistiques est donc central aux travaux en production-perception de la parole.
Appréhender les dimensions perceptives – auditive et visuelle – de la parole requiert une bonne maîtrise de la relation non-linéaire (mal-posée) entre la sortie acoustique et l’origine articulatoire des sons. L’inversion acoustique articulatoire consiste ainsi à retrouver l’évolution de la forme du conduit vocal à partir du signal de parole.
La compréhension des mécanismes de contrôle de la production de la parole passe, selon nous, par le développement et l'évaluation de modèles du contrôle moteur et de modèles physiques de l'appareil de production de la parole. C'est la comparaison de données mesurées sur des locuteurs, dans des conditions bien contrôlées avec les prédictions proposées par ces modèles, qui permet d'évaluer, de manière quantitative et objective, les différentes hypothèses attestées dans la littérature sur le contrôle de la production de la parole.

Pour étudier le contrôle moteur des gestes humains en général, ainsi que leur efficacité perceptive, le substrat de base est constitué d'une quantité très importante de données physiologiques, cinématiques, acoustiques et éventuellement dynamiques, collectées sur des locuteurs humains. Cette étape de collecte et d'analyse de données est indispensable ; elle a constamment progressé au cours des vingt dernières années.
Malgré ces avancées, le manque de données cinéradiographiques se fait cruellement ressentir dans la communauté scientifique, préoccupée par l’étude de la production et de la perception de la parole. En effet, elles sont les seules à offrir actuellement, en même temps, une résolution spatiotemporelle correcte, sur l'ensemble du conduit vocal, dans le plan sagittal. Or, l’acquisition de nouvelles données cinéradiographiques est aujourd’hui restreinte, voire interdite dans certains pays.
Notre projet de recherche sur le contrôle moteur des gestes humains en général, ainsi que sur leur efficacité perceptive a visé, en conséquence, à valoriser et à diffuser une partie des nombreux films cinéradiographiques (ou radiofilms) sur la production et la perception de la parole qui ont été réalisés à l'Institut de Phonétique de Strasbourg (IPS), depuis la fin des années 50. Le programme a concerné une vingtaine de films de très bonne qualité, portant sur des problématiques linguistiques de langues parlées en Europe, en Afrique, en Asie et en Amérique Latine.

Il a été organisé autour de 4 objectifs principaux, trois spécifiques et un général qui correspondait aux axes de recherche:
1- la sauvegarde de ces données cinéradiographiques patrimoniales ;
2- leur traitement (grâce au développement d’outils) ;
3- leur valorisation par l’intégration dans une base, l’organisation d’ateliers et de colloques ;
4- leur analyse, ainsi que leur exploitation pour des objectifs de recherche fondamentale sur la production de la parole (la coarticulation, l’étude de l’inversion et l’évaluation de modèles physiques de la production de la parole).

À l'issue du projet, nous avons mis à la disposition de la communauté scientifique :
1- un ensemble de données multilingues et multimédia, unique au monde, sur la production et la perception de la parole, comprenant images cinéradiographiques du conduit vocal, signal acoustique et tracés sagittaux des contours du conduit vocal, le tout synchronisé, qui sera accessible au sein d'une plateforme de traitement ;
2- des outils et des logiciels d’exploitation adaptés, permettant d’extraire les informations linguistiques de ces données.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31