Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
FIROUZMAND Mohammad

Modélisation sinusoïdale à long terme du signal de parole.

 

Co-encadrant :     Laurent GIRIN

École doctorale :

Spécialité :

Structure de rattachement : Grenoble-INP

Établissement d'origine : INPG

Financement(s) : bourse attribuée par un gouvernement étranger

 

Date d'entrée en thèse : 00/00/0000

Date de soutenance : 06/04/2007

 

Composition du jury :
Pascal Perrier (président)
Frédéric Bimbot (rapporteur)
Gaël Richard (rapporteur)
Myriam Desainte-Catherine (examinatrice)
Olivier Rosec (examinateur)
Laurent Girin (directeur de thèse)

 

Résumé : La modélisation sinusoïdale du signal de parole est usuellement définie à « court terme », c'est-à-dire sur des trames successives de signal d'une durée de l'ordre de 10 à 30 ms. Cette thèse apporte une contribution nouvelle à ce domaine en ajoutant à ce niveau traditionnel de modélisation spectrale un niveau supplémentaire le long de l'axe temporel : on cherche à modéliser les trajectoires de paramètres sinusoïdaux (amplitudes et phases) sur des durées significativement plus longues que celles des trames à court terme (typiquement plusieurs centaines de ms ; on considère dans cette thèse des sections de parole continûment voisées). Nous proposons pour cela d'utiliser différents modèles à long terme à base de fonctions en cosinus discrets et de fonctions polynomiales. L'ajustement des trajectoires est réalisé par une régression au sens des moindres carrés pondérés, les poids de la régression étant déterminés par des critères perceptifs adaptés au traitement à long terme. Pour cette tâche, une série d'algorithmes itératifs est proposée et testée. L'approche à long terme se révèle à la fois efficace et parcimonieuse pour décrire la dynamique des signaux de parole voisés.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31