Architecture-Géométrie, Perception, Images, Gestes
Responsable(s) d'équipe : Isabelle SIVIGNON, Michèle ROMBAUT
Directeur de thèse : Pascal BERTOLINO
École doctorale : Electronique, electrotechnique, automatique, traitement du signal (EEATS)
Spécialité : Signal, image, parole, télécoms
Structure de rattachement : Grenoble-INP
Établissement d'origine :
Financement(s) :
Date d'entrée en thèse : 01/10/2003
Date de soutenance : 14/02/2007
Composition du jury :
James L. Crowley (président)
Dominique Barba (rapporteur)
Henri Nicolas (rapporteur)
Pascal Bertolino (directeur de thèse)
Anne Guerin-Dugue (examinatrice)
Résumé : La description synthétique du contenu d'une image ou d'une vidéo est à l'heure actuelle une problématique majeure. Nous nous intéressons aux objets qui les composent pour leur pouvoir de représentativité. Après un état de l'art, ce document présente une méthode de segmentation locale par pyramide de graphes irrégulière permettant d'extraire, à partir de critères bas niveaux, des régions d'intérêt assimilables à des objets sémantiques. Cette méthode est utilisée pour détourer avec précision des objets dans des images fixes, dans un environnement interactif puis totalement automatique. Une estimation de mouvement permet d'étendre le procédé aux vidéos en extrayant dans chaque image les entités mobiles. Un filtrage et une classification de ces entités permet de ne retenir que les plus représentatives de chaque objet réel du plan. Ces représentants sont appelés objet-clé et vues-clés. La qualité des résultats expérimentaux permet de proposer de nombreuses applications en aval.