Directory Intranet
Chargement

SpeakRightNow - Incremental speech synthesis for speech-handicapped people

Project Coordinator : Thomas HUEBER

Project realized thanks to the support of : BQR-AGIR

Start date : 2014/10/01

Duration : 24 mounths


Web site : http://www.gipsa-lab.fr/projet/SpeakRightNow/

Pour certaines personnes lourdement handicapées, l’utilisation d’un système de synthèse vocale à partir du texte (TTS : Text-to-speech) est parfois l’unique moyen de communiquer oralement. Cependant, si les systèmes TTS permettent aujourd’hui de générer une parole d’une intelligibilité suffisante, ils ne peuvent que très difficilement être utilisés de façon « interactive » (conversation face-à-face ou téléphonique, prise de parole dans une assemblée, etc.). En effet, les systèmes actuels nécessitent que l’intégralité de chaque phrase à vocaliser soit connue, pour débuter la génération du signal de parole (et ce notamment pour générer "l'intonation" de la voix de synthèse). Dans une interaction s’effectuant par l’intermédiaire d’un système TTS, le destinataire doit donc attendre que l’émetteur du message ait saisi intégralement le texte à vocaliser, avant d’entendre le moindre son. Ainsi, le patient - comme ses interlocuteurs - ressentent inévitablement une certaine frustration causée par ce manque de réactivité des systèmes TTS. Ainsi, l’acceptabilité de dispositifs d’aide à la communication intégrant une brique TTS dépend de cette capacité à lever ce verrou interactionnel que constitue la latence de la verbalisation.

Le projet SpeakRightNow a pour but de développer une nouvelle génération de synthétiseur TTS, dit « incrémental », capable de débuter la synthèse audio avant que l’utilisateur n’ait terminé de saisir complètement la phrase à synthétiser. Dans l’approche proposée, la synthèse de la parole accompagne la saisie du texte, elle est déclenchée avant que la totalité de la phrase à synthétiser ne soit connue. Le synthétiseur se comporte alors comme un lecteur humain, capable de débuter « en ligne » la vocalisation d’une phrase sans connaître cette dernière entièrement


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31