Vous êtes ici : GIPSA-lab > CRISSPAccueil CRISSP
 
Équipe

COGNITIVE ROBOTICS, INTERACTIVE SYSTEMS, & SPEECH PROCESSING
Responsable(s) d'équipe : Gérard BAILLYThomas HUEBER

L’équipe CRISSP mène des recherches fondamentales et appliquées dans le domaine de la communication parlée. Nos travaux visent notamment : 

    • à capturer, analyser et modéliser les différents signaux verbaux et co-verbaux mis en jeu dans une situation d’interaction communicationnelle entre deux humains, ou entre un humain et un robot humanoïde.
    • à mieux comprendre la production de la parole, en modélisant notamment les relations entre l’activité articulatoire (c’est-à-dire le mouvement de la langue, des lèvres, etc.), et le signal acoustique.
    • à mieux comprendre les mécanismes de communication chez les personnes malentendantes
    • à concevoir des outils technologiques pour la rééducation orthophonique, la suppléance vocale, le divertissement et les robots humanoïdes

 

Les 3 axes de recherches de l’équipe CRISSP sont :

    • Robotique cognitive : développer les capacités socio-communicatives de robots humanoïdes communicants.
    • Systèmes interactifs : développer des systèmes réactifs de communication « augmentée » exploitant des caractéristiques multimodales de la parole (son, vision, gestes).
    • Traitement de la parole : étude de l’appareil de production de la parole (modélisation articulatoire-acoustique), synthèse vocale et conversion de voix.

Domaines d’expertises de l’équipe

    • Traitement du signal audio (analyse, compression, filtrage, débruitage par séparation de sources, etc.) et en particulier le signal de parole (analyse, transformation, morphing, reconnaissance automatique, synthèse à partir du texte, synthèse articulatoire, inversion acoustico-articulatoire)
    • Modélisation par apprentissage statistique (machine learning
    • Acquisition de données articulatoires (electrographie electromagnétique (EMA), imagerie ultrasonore, IRM, video rapide, EMG).
    • Conception de protocoles expérimentaux nécessitant l’acquisition simultanée de différents signaux verbaux et co-verbaux sur un ou plusieurs humains en situation d’interaction (motion capture, eye-tracking, etc.)

 

Les membres

(photo prise le 18/12/2015)

 

Contact : Gérard Bailly et Thomas Hueber (e-mail : prenom.nom@gipsa-lab.fr)



A la une
RecrutementGIPSA-Lab recrute pour 12 mois un Post-doc (H/F) - Evaluation automatique de la fluence de jeunes lecteurs, pour l'équipe CRISSP

La caractéristique importante des lectures à haute voix produites par les lecteurs débutants est la prévalence de disfluences telles que pauses incongrues, répétitions et faux départs. L'objectif de ce travail est de détecter ces disfluences et de quantifier leur impact sur la qualité perçue de la lecture en utilisant les techniques d'apprentissage automatique à l'état de l'art. Dans le cadre du projet e-FRAN Fluence (fluence.prod.lamp.cnrs.fr), nous allons en effet collecter des lectures enfantines de manière massive.

Lire la suite



Dernières publications de l'équipe

Semi-supervised multichannel speech enhancement with variational autoencoders and non-negative matrix factorization

Simon Leglaive, Laurent Girin, Radu Horaud. Semi-supervised multichannel speech enhancement with variational autoencoders and non-negative matrix factorization. IEEE International Conference on Acoustics Speech and Signal Processing (ICASSP 2019), May 2019, Brighton, United Kingdom. IEEE, pp.1-5. 〈hal-02005102〉

Speech enhancement with variational autoencoders and alpha-stable distributions

Simon Leglaive, Umut Simsekli, Antoine Liutkus, Laurent Girin, Radu Horaud. Speech enhancement with variational autoencoders and alpha-stable distributions. ICASSP 2019 - IEEE International Conference on Acoustics Speech and Signal Processing, May 2019, Brighton, United Kingdom. IEEE, pp.1-5, 2019, 〈https://2019.ieeeicassp.org〉. 〈hal-02005106〉

Multichannel Speech Separation and Enhancement Using the Convolutive Transfer Function

Xiaofei Li, Laurent Girin, Sharon Gannot, Radu Horaud. Multichannel Speech Separation and Enhancement Using the Convolutive Transfer Function. IEEE/ACM Transactions on Audio, Speech and Language Processing, Institute of Electrical and Electronics Engineers, 2019, 27 (3), pp.645-659. 〈10.1109/TASLP.2019.2892412〉. 〈hal-01799809〉


Voir toutes les publications de l'équipe dans HAL
GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31