Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
SIMAC LEJEUNE Alain

Modélisation et gestions de concepts, particulièrement temporels, pour l'assistance à la caractérisation de séquences d'images

 

Directeur de thèse :     Michèle ROMBAUT

École doctorale : Ecole Doctorale de l''Université de Savoie

Spécialité :

Structure de rattachement : Autre

Établissement d'origine : Autre

Financement(s) : bourse attribuée par une collectivité territoriale

 

Date d'entrée en thèse : 15/10/2007

Date de soutenance : 14/06/2011

 

Composition du jury :
Mr. Pierre MORIZET-MAHOUDEAUX,Professeur à l'UTC, Compiègne,Rapporteur
Mr. Rémy MULLOT, Professeur à l'Université de La Rochelle, La Rochelle, Rapporteur
Mr. Alain TREMEAU, Professeur à l'Université Jean Monnet, Saint-Etienne, Examinateur
Mr. Stéphane BRES, Maître de Conférence à l'INSA, Lyon, Examinateur
Mr. Patrick LAMBERT,Professeur à l'Université de Savoie, Annecy, Directeur de thèse
M. Michèle ROMBAUT, Professeur à l'Université Joseph-Fourier, Grenoble, Directrice de thèse

 

Résumé : Les techniques habituelles d'indexation de vidéos passent généralement par une phase d'apprentissage qui nécessite préalablement la constitution d'une base d'apprentissage. Même si la taille de cette base est réduite, la phase d'annotation réalisée par un expert de l'application est souvent longue et fastidieuse. Dans le cadre de cette thèse, nous avons développé un dispositif qui permet de pré-sélectionner un ensemble de prototypes susceptibles de contenir le concept qui doit apparaître dans la base d'apprentissage. Cette base réduite de prototypes sera ensuite annotée par l'expert. Nous nous sommes intéressés à des concepts temporels, ce qui nous a amené à étudier particulièrement des caractéristiques liées au mouvement, comme les points d'intérêt spatio- temporels (STIP Spatial Temporal Interest Points). D'autres caractéristiques ont aussi été utilisées concernant la couleur et la présence de formes particulières. Ces caractéristiques sont ensuite exploitées pour structurer la base de vidéos en briques spatio-temporelles homogènes. Cette structuration correspond à une sorte de segmentation de la base en fonction de chacune des caractéristiques. La liaison entre le concept à définir et les briques extraites de la base est en lien avec le fossé sémantique bien connu dans la problématique d'indexation automatique. La création de ce lien nécessite l'utilisation de la connaissance de l'expert de l'application sur le concept. Nous avons développé un système dans lequel cette connaissance est extraite par un système de questions/réponses. Les couples de questions/réponses permettent de sélectionner des briques répondant à la contrainte, de définir des relations entre certaines briques, et en- fin de naviguer dans l'arborescence des questions. Des tests ont été réalisés sur des bases de vidéos de provenances diverses telles que des vidéos provenant d'émissions de télévision, de films d'animation, ou encore des vidéos de laboratoire disponibles sur le net, ou réalisées par nos soins. Ces tests montrent les performances satisfaisantes mais aussi les limites de l'approche et ouvrent des perspectives intéressantes, particulièrement sur les aspects collaboratifs et les aspects adaptatifs qui permettraient de capitaliser les connaissances des experts applicatifs et rendraient le système plus efficient.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31