Séminaire Modélisation statistique
organisé par l'équipe Modélisation et contrôle
-
Jean-Michel Bécu
Sélection de variable par la ridge adaptative
10 novembre 2014 - 13:00Salle de séminaires IRMA
Attention : le séminaire a lieu en salle 309 et commence à 13 heures. La régression pénalisée par la norme l1 (lasso) et ses variantes sont couramment utilisées pour la sélection de variables. Dans des problèmes de grande dimension, ces méthodes parcimonieuses ne permettent pas de contrôler les incertitudes liées à cette sélection. Nous proposons une approche en deux étapes, inspirée de la méthode "Screening and cleaning'' (Wasserman et Roeder, 09) et de l'adaptive Lasso. Cette méthode consiste en une première étape de criblage où l'on récupère le support du lasso, qui regroupe les variables potentiellement pertinentes; et une seconde étape de nettoyage où l'on calcule des p-valeurs sur ces variables potentiellement pertinentes, en utilisant une régression ridge avec une pénalité spécifique. Ce travail est basé sur deux problèmatiques, la premières et le transfert du maximum d'information entre les deux étapes et la seconde sur les tests statistiques sur le régression ridge du à la pénalité en norme l2. La régression ridge nous permet de contrôler le risque de première espèce sur chaque variable testée. Le taux de faux positifs, sur l'ensemble des variables, est ensuite contrôlé par une procédure de correction de tests multiples. Dans nos expériences, nous observons une augmentation quasi-systématique de la sensibilité par rapport à la procédure originale de Wasserman et Roeder.