Vous êtes ici : GIPSA-lab > Formation > Thèses soutenues
Chargement
CHIANCONE Alessandro

Réduction de dimension via Sliced Inverse Regression : Idées et nouvelles propositions

 

Co-directeur de thèse :     Jocelyn CHANUSSOT

École doctorale : Mathématiques, sciences et technologies de l'information, informatique (mstii)

Spécialité : MA-Mathématiques Appliquées

Structure de rattachement : UJF

Établissement d'origine :

Financement(s) : Contrat doctoral

 

Date d'entrée en thèse : 01/10/2013

Date de soutenance : 28/10/2016

 

Composition du jury :
STEPHANE GIRARD - Examinateur
JOCELYN CHANUSSOT - Examinateur
MARIE CHABERT - Rapporteur
JERÔME SARACCO - Rapporteur
FLORENCE FORBES - Examinateur
ANNE-FRANÇOISE YAO - Examinateur

 

Résumé : Cette thèse propose trois extensions de la Régression linéaire par tranches (Sliced Inverse Regression, SIR), notamment Collaborative SIR, Student SIR et Knockoff SIR. Une des faiblesses de la méthode SIR est l'impossibilité de vérifier si la Linearity Design Condition (LDC) est respectée. Il est établi que, si x suit une distribution elliptique, la condition est vraie ; dans le cas d'une composition de distributions elliptiques il n y a aucune garantie que la condition soit vérifiée globalement, pourtant, elle est respectée localement. On va donc proposer une extension sur la base de cette considération. Étant donné une variable explicative x, Collaborative SIR réalise d'abord un clustering. Pour chaque cluster, la méthode SIR est appliquée de manière indépendante. Le résultat de chaque composant contribue à créer la solution finale. Le deuxième papier, Student SIR, dérive de la nécessité de robustifier la méthode SIR. Vu que cette dernière repose sur l'estimation de la covariance et contient une étape APC, alors elle est sensible au bruit. Afin d'étendre la méthode SIR on a utilisé une stratégie fondée sur une formulation inverse du SIR, proposée par R.D. Cook. Finalement, Knockoff SIR est une extension de la méthode SIR pour la sélection des variables et la recherche d'une solution sparse, ayant son fondement dans le papier publié par R.F. Barber et E.J. Candès qui met l'accent sur le false discovery rate dans le cadre de la régression. L'idée sous-jacente à notre papier est de créer des copies de variables d'origine ayant certaines proprietés. On va montrer que la méthode SIR est robuste par rapport aux copies et on va proposer une stratégie pour utiliser les résultats dans la sélection des variables et pour générer des solutions sparse


GIPSA-lab, 11 rue des Mathématiques, Grenoble Campus BP46, F-38402 SAINT MARTIN D'HERES CEDEX - 33 (0)4 76 82 71 31