Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
FUX Thibaut

Vers un système indiquant la distance d’un locuteur par transformation de sa voix

 

Directeur de thèse :     Gang FENG

École doctorale : Electronique, electrotechnique, automatique, traitement du signal (eeats)

Spécialité : Signal, image, parole, télécoms

Structure de rattachement : Grenoble-INP

Établissement d'origine :

Financement(s) : contrat à durée déterminée

 

Date d'entrée en thèse : 01/10/2008

Date de soutenance : 24/05/2012

 

Composition du jury :
M Pierre-Yves COULON (examinateur)
M Jean-Sylvain LIÉNARD (rapporteur)
M Olivier BOËFFARD (rapporteur)
M Olivier ROSEC (examinateur)
M Gang FENG (directeur de thèse)
Mme Véronique ZIMPFER (co-directrice de thèse)

 

Résumé : Cette thèse porte sur la transformation de la voix d'un locuteur dans l'objectif d'indiquer la distance de celui-ci : une transformation en voix chuchotée pour indiquer une distance proche et une transformation en voix criée pour une distance plutôt éloignée. Pour ce faire, nous effectuons des analyses approfondies pour chercher à déterminer les propriétés les plus pertinentes dans une voix chuchotée et dans une voix criée. La contribution principale de cette partie est de montrer la pertinence des paramètres prosodiques dans la perception de l'effort vocal dans une voix criée. Nous proposons ensuite des descripteurs permettant de mieux caractériser les contours prosodiques. Pour la transformation proprement dite, nous proposons plusieurs nouvelles règles de transformation qui contrôlent de manière primordiale la qualité des voix transformées. Les résultats ont montré une très bonne qualité des voix chuchotées transformées et surtout (car très difficile) des voix criées pour des structures linguistiques relativement simples (CVC, CVCV, etc).


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31