Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
HARRIS Jack

« Séparation de sources en ligne dans des environnements réverbérants en exploitant la localisation des sources »

 

Directeur de thèse :     Christian JUTTEN

Co-encadrant :     Bertrand RIVET

École doctorale : Electronique, electrotechnique, automatique, traitement du signal (eeats)

Spécialité : Signal, image, parole, télécoms

Structure de rattachement : Grenoble-INP

Établissement d'origine : Loughborough University - Angleterre

Financement(s) : Bourse dga

 

Date d'entrée en thèse : 01/10/2011

Date de soutenance : 12/10/2015

 

Composition du jury :
Christian JUTTEN - Directeur de thèse
Bertrand RIVET - Co-encadrant de thèse
Jonathon CHAMBERS - CoDirecteur de thèse
Yannick DEVILLE - Rapporteur
Mandic DANILO - Rapporteur
Paul LEPPER - Examinateur

 

Résumé : Cette thèse porte sur les techniques de séparation de sources en aveugle en utilisant des statistiques de second ordre et statistiques d'ordre supérieur pour les environnements de réverbération. Un objectif de la thèse est la simplicité algorithmique en vue de l'implantation en ligne des algorithmes. Le principal de ces applications de séparation de sources aveugles est de s'occuper des environnements acoustiques de réverbération ; une complication supplémentaire concerne les changements dans l'environnement acoustique lorsque les sources humaines se déplacent physiquement. Une nouvelle méthode dans le domaine temporel qui utilise une paire de IItres a réponse impulsionnelle nie est proposée. Cette méthode, dite les angles principaux, sur un décomposition en valeurs singulières. Une paire de Itres, jouant le rôle de beamforming est estimée de façon à annuler une des sources. Une étape de ltrage adaptatif est ensuite utilisée pour récupérer la source restante, en exploitant la sortie de l'étage de beamforming en tant que une référence de bruit. Une approche commune de la séparation de sources aveugle est d'utiliser des méthodes fondée sur les statistiques d'ordre supérieur comme l'analyse en composantes indépendantes. Cependant, pour des mélanges convolutifs audio et vocales réalistes, la transformation dans le domaine fréquentiel pour chaque fréquence de calcul est nécessaire. Ceci introduit le problème de permutations, inhérentes à l'analyse en composantes indépendantes, pour toutes les fréquences. L'analyse en vecteur indépendant résout directement cette question par la modélisation des dépendances en tre les fréquences de calcul, a partir d'apriori sur les sources. Une algorithme de gradient naturel en temps réel est également proposé avec un autre a priori sur les sources. Cette méthode exploite la fonction de densité de probabilité de Student, est connu pour être bien adaptée pour les sources de parole, en raison de queues de distribution plus lourdes. L'algorithme nal est implanté en temps réel sur un processeurs numérique de signal a virgule ottante de Texas Instruments. Les sources mobiles, avec des environnements reverberatant, causent des problèmes significatifs dans les systèmes de séparation de sources réalistes car las ltres de mélange deviennent variantes dans le temps. Dans ce cadre, une méthode qui utilise conjointement le principe de la paire de ltres d'annulation et le principe de l'analyse en vecteurs indépendant. Cette approche permet de limiter les baisses de performance lorsque les sources sont mobiles. Les résultats montrent également que les temps moyen de convergence des divers paramètres sont diminués. Les méthodes en ligne qui sont introduites dans la thèse, sont testées en utilisant des réponse impulsionnelles mesurées dans des environnements de réverbération. Les résultats montrent leur robustesse et d'excellentes performances par rapport à d'autres méthodes classiques dans plusieurs situations expérimentales.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31