Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
LELONG Amlie

Convergence phonétique en interaction

 

Directeur de thèse :     Gérard BAILLY

École doctorale : Electronique, electrotechnique, automatique, traitement du signal (eeats)

Spécialité : Signal, image, parole, télécoms

Structure de rattachement : Université de Grenoble

Établissement d'origine : INPG - ENSERG

Financement(s) : bourse attribuée par une collectivité territoriale

 

Date d'entrée en thèse : 01/03/2009

Date de soutenance : 03/07/2012

 

Composition du jury :
Laurence Nigay, Professeur à l''université Joseph Fourier, Présidente Noël Nguyen, Professeur à l''université de Provence, Rapporteur Jean-François Bonastre, Professeur à l''université d''Avignon et des pays de Vaucluse, Rapporteur Martine Adda-Decker, Directeur de Recherche au Laboratoire de Phonétique et Phonologie, Examinatrice Gérard Bailly, Directeur de Recherche au GIPSA-Lab, Directeur de thèse

 

Résumé : Pendant une interaction, les interlocuteurs adaptent leur manière de parler à celle de leur partenaire suivant de multiples dimensions. Cette adaptation a un but communicatif, notamment lié au lien social établi ou à établir. Il paraît donc crucial d'intégrer cette stratégie d'adaptation aux systèmes d'interaction homme-machine. Pendant cette thèse, nous avons développé des paradigmes originaux pour étudier, caractériser et évaluer le phénomène de convergence phonétique. Nous avons d'abord introduit un jeu de langage - les dominos verbaux - qui permet de recueillir des échantillons de parole pavant l'espace phonétique des interlocuteurs. Deux méthodes de caractérisations objectives ont été développées: une première basée sur une analyse discriminante linéaire entre les coefficients spectraux extraits des signaux de parole de chaque interlocuteur et une seconde méthode utilisant la reconnaissance du locuteur. Une méthode de caractérisation subjective, basé sur un nouveau test de perception appelé détection de changement de locuteurs (speaker switching), a également été développée pour étudier la sensibilité à la convergence d'auditeurs tiers. Ce test de perception a été réalisé à partir de signaux extraits de notre corpus mais également avec des signaux créés par synthèse adaptative. Les résultats obtenus nous montrent que la convergence phonétique est un phénomène complexe, dépendant de nombreux paramètres tels que le sexe ou la distance sociale des paires étudiées. La reconnaissance du locuteur nous permet d'obtenir une méthode de caractérisation globale et rapide, permettant ainsi aux machines d'intégrer la parole dans leur évaluation des stratégies d'adaptation de leur partenaire humain et de s'adapter à leur tour.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31