Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
LIENHARD Arnaud

Estimation automatique des impressions véhiculées par une photographie de visage

 

Directeur de thèse :     Alice CAPLIER

École doctorale : Electronique, electrotechnique, automatique, traitement du signal (eeats)

Spécialité : Signal, image, parole, télécoms

Structure de rattachement : Grenoble-INP

Établissement d'origine :

Financement(s) : Contrat doctoral

 

Date d'entrée en thèse : 01/10/2012

Date de soutenance : 26/11/2015

 

Composition du jury :
Jean-Luc DUGELAY, Professeur EURECOM, Rapporteur
Patrick Le CALLET, Professeur Université de Nantes, Rapporteur
Michèle ROMBAUT, Professeur Université Joseph Fourier, Examinateur
Marina NICOLAS, Ingénieur de Recherche STMicroelectronics, Examinateur
Alice CAPLIER, Professeur INPG, Directeur de thèse
Patricia LADRET, Maître de conférence Université Joseph Fourier, Encadrant de thèse

 

Résumé : Avec le développement des appareils photos numériques et des sites de partage de photos, nous passons une part croissante de notre temps à observer, sélectionner et partager des images, parmi lesquelles figurent un grand nombre de photos de visage. Dans ce travail, nous nous proposons de créer un premier système entièrement automatique renvoyant une estimation de la pertinence d'une photo de visage pour son utilisation dans la création d'un album de photos, la sélection de photos pour un réseau social ou professionnel, etc. Pour cela, nous créons plusieurs modèles d'estimation de la pertinence d'une photo de visage en fonction de son utilisation. Dans un premier temps, nous adaptons les modèles d'estimation de la qualité esthétique d'une photo au cas particulier des photos de visage. Nous montrons que le fait de calculer des caractéristiques décrivant différents aspects de l'image (texture, illumination, couleurs) dans des régions spécifiques du visage (les yeux, la bouche) améliore significativement la précision des estimations par rapport aux autres modèles de l'état de l'art. La précision de ce modèle est renforcée par la sélection de caractéristiques adaptées à notre problème, ainsi que par la fusion des prédictions fournies par différents algorithmes d'apprentissage. Dans un second temps, nous proposons d'enrichir l'évaluation automatique d'une photo de visage en définissant des modèles d'estimation associés à des critères tels que le degré de sympathie ou de compétence dégagé par une photo de visage. Ces modèles reposent sur l'utilisation d'attributs de haut niveau (présence de sourire, ouverture des yeux, estimation des expressions faciales), qui se montrent plus efficaces que les caractéristiques de bas niveau utilisées dans l'état de l'art (filtres de Gabor, position des points de repère du visage). Enfin, nous fusionnons ces modèles afin de sélectionner automatiquement des photos de bonne qualité esthétique et appropriées à une utilisation donnée : photos inspirant de la sympathie à partager en famille, photos dégageant une impression de compétence sur un réseau professionnel.


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31