Directeur de thèse : Denis PELLERIN
École doctorale : Electronique, electrotechnique, automatique, traitement du signal (EEATS)
Spécialité : Signal, image, parole, télécoms
Structure de rattachement : UJF
Établissement d'origine : UJF
Financement(s) : CIFRE
Date d'entrée en thèse : 01/12/2005
Date de soutenance : 25/05/2009
Composition du jury :
Jenny BENOIS-PINEAU, rapporteur
Olivier COLOT, rapporteur
Sylvie PHILIPP-FOLIGUET
Jean–Michel RENDERS
Michèle ROMBAUT
Denis PELLERIN, directeur de thèse
Olivier BUISSON, co-directeur (INA)
Marie-Luce VIAUD, co-directeur (INA)
Résumé : Cette thèse se situe dans le contexte général de l'indexation de base d'images. Devant l'accroissement des volumes et la complexité des traitements documentaires de ces bases (corrélée au problème bien connu du fossé sémantique), il est difficile d'envisager des systèmes performants entièrement automatiques pour organiser une base d'images en différentes classes. Nous proposons un système d'assistance (semi-automatique) pour la structuration de collections d'images. Ce système se compose de trois parties : un module de modélisation de la connaissance , un module de sélection active d'images et un module interface homme-machine . A partir des descripteurs visuels calculés sur les images et les actions de l'utilisateur, qui peut créer et modifier des classes, le système utilise le formalisme du Modèle des Croyances Transférables (TBM) pour modéliser l'état d'appartenance de chaque image à l'ensemble des classes existantes. Un processus d'apprentissage actif permet de mettre en oeuvre différentes stratégies de sélection d'images pouvant aider l'utilisateur à identifier les compositions des classes. Le formalisme des TBM permet également la mise en oeuvre de classification non-exclusive ou multi étiquette se révélant très pertinent dans le cas des images. Ce prototype a été validé sur des jeux de tests de référence et des collections d'images personnelles ou issues du fond de l'INA, et présentent de très bonnes performances. Une évaluation a été conduite auprès d'utilisateurs professionnels et a montré des résultats extrêmement positifs en termes d'utilité, d'utilisabilité et de satisfaction.