Directeur de thèse : Jean-Luc SCHWARTZ
École doctorale : Mathématiques, sciences et technologies de l'information, informatique (MSTII)
Spécialité :
Structure de rattachement : UJF
Établissement d'origine : UJF
Financement(s) :
Date d'entrée en thèse : 01/10/2010
Date de soutenance : 08/10/2014
Composition du jury :
BESSIÈRE Pierre, DR CNRS, Institut des Systèmes Intelligents et de Robotique
DIARD Julien, CR CNRS, Laboratoire de Psychologie et NeuroCognition
DUPOUX Emmanuel, professeur EHESS, Laboratoire de Sciences Cognitives et Psycholinguistique
LAPRIE Yves, DR CNRS, Laboratoire lOrrain de Recherche en Informatique et ses Applications
MOORE Roger, Chair of Spoken Language Processing, University of Sheffield
OUDEYER Pierre-Yves, DR CNRS, Institut National de Recherche en Informatique et en Automatique
PERRIER Pascal, professeur INP, GIPSA-Lab - Département Parole et Cognition
SCHWARTZ Jean-Luc, DR CNRS, GIPSA-Lab - Département Parole et Cognition
Résumé : Si la parole est une faculté dont l'usage nous semble tout à fait naturel, il reste toutefois beaucoup à comprendre sur la nature des représentations et des processus cognitifs qui la gouvernent. Au coeur de cette thèse se trouve la question des interactions entre perception et action dans la production et la perception de syllabes. Nous adoptons le cadre de la programmation bayésienne au sein duquel nous définissons mathématiquement le modèle COSMO (pour Communicating Objects using Sensori-Motor Operations), qui permet de formaliser et d'étudier quantitativement les théories de la communication parlée. Nous mettons en évidence des conditions idéales d'apprentissage sous lesquelles les théories motrice et auditive sont indistinguables. Pour s'en éloigner, nous proposons un algorithme d'apprentissage sensorimoteur par accommodation, qui permet de s'adapter au bain acoustique ambiant tout en développant des idiosyncrasies. Nous discutons les dynamiques d'évolution ainsi que la robustesse aux dégradations des modèles appris.