Séminaire Statistique
organisé par l'équipe Statistique
-
Benjamin Bobbia
Extreme quantile regression: a coupling approach and Wasserstein distance.
11 janvier 2021 - 13:00Web-séminaire
In this work, we develop two coupling approaches for extreme quantile regression. We consider i.i.d copies of $Y \in \mathbb{R}$ and $X \in \mathbb{R}^d$ and we want an estimation of the conditional quantile of $Y$ given $X=x$ of order $1-\alpha$ for a very small $\alpha >0$. We introduce the proportional tail model, strongly inspired by the heteroscedastic extremes developped by Einmahl, de Haan and Zhou. The main assumption is that the tail distribution of $Y$ is asymptotically proportional to the conditional tail of $Y$ given $X=x$. We propose and study estimators of both model parameters and conditional quantile, which are studied by coupling methods. The first method is based on coupling of empirical processes while the second is related with optimal transport. Even if we establish the asymptotic normality of parameter estimators with both methods, the first is focused on the proper quantile estimation whereas the second is more focused on the estimation of the extreme value index in presence of bias and the elaboration of a validation procedure for our model. -
José Gómez García
Apprentissage de modèles CHARME avec des réseaux de neurones.
25 janvier 2021 - 13:00Web-séminaire
Nous considérons un modèle appelé CHARME (Conditional Heteroscedastic Autoregressive Mixture of Experts). Concrètement, c'est un modèle de mélange généralisé de séries chronologiques non linéaire et non paramétrique AR-ARCH. Nous prouvons la stabilité (ergodicité et stationnarité) du modèle sous certaines conditions de type Lipschitz pour les fonctions d'autorégression et de volatilité, lesquelles sont beaucoup plus faibles que celles présentées dans la littérature existante. Ce résultat combiné avec des arguments d'epi-convergence nous permet de démontrer la consistance forte de l'estimateur des fonctions d'autorégression et de volatilité sans hypothèse de différentiabilité sur ces fonctions. En outre, nous utilisons les résultats précédents et la propriété d'approximation universelle de réseaux de neurones (RN), pour développer une théorie d'apprentissage pour les fonctions d'autorégression-basées-sur-RN du modèle. La consistance forte et la normalité asymptotique de l'estimateur des poids et des biais des RN considéré sont aussi démontrées sous de conditions faibles. -
Feriel Bouhadjera
Estimation non paramétrique locale linéaire de la fonction de régression relative pour un modèle de censure
1 février 2021 - 13:00Web-séminaire
Dans ce travail, nous construisons un nouvel estimateur non paramétrique de la fonction de régression en utilisant l’erreur quadratique relative moyenne. C’est une approche alternative à la régression classique qui est résistante et moins influencée par la présence des valeurs aberrantes. Nous utilisons l’approche linéaire locale qui a l’avantage de résister aux effets de bord lorsque les données sont censurées aléatoirement à droite. Sous des hypothèses appropriées, la convergence uniforme presque sûre (sur un compact) avec vitesse est établie. Au moyen d’une étude sur des données simulées, nous montrons les performances et l’efficacité de la méthode étudiée. -
Youssef Esstafa
Estimation et validation des modèles FARIMA faibles
15 février 2021 - 13:00Web-séminaire
Dans ce travail nous considérons, le problème de l'analyse statistique des modèles FARIMA (Fractionally AutoRegressive Integrated Moving-Average) induits par un bruit blanc non corrélé mais qui peut contenir des dépendances non linéaires très générales. Ces modèles sont appelés FARIMA faibles et permettent de modéliser des processus à mémoire longue présentant des dynamiques non linéaires, de structures souvent non-identifiées, très générales. Relâcher l'hypothèse d'indépendance sur le terme d'erreur, une hypothèse habituellement imposée dans la littérature, permet aux modèles FARIMA faibles d'élargir considérablement leurs champs d'application en couvrant une large classe de processus à mémoire longue non linéaires. Nous établissons les procédures d'estimation et de validation des modèles FARIMA faibles. Nous montrons, sous des hypothèses faibles de régularités sur le bruit, que l'estimateur des moindres carrés des paramètres des modèles FARIMA(p,d,q) faibles est convergent et asymptotiquement normal. La matrice de variance asymptotique de l'estimateur des moindres carrés des modèles FARIMA(p,d,q) faibles est de la forme "sandwich". Cette matrice peut être très différente de la variance asymptotique obtenue dans le cas fort (i.e. dans le cas où le bruit est supposé iid). Nous proposons, par deux méthodes différentes, un estimateur convergent de cette matrice. Une méthode alternative basée sur une approche d'auto-normalisation est également proposée pour construire des intervalles de confiance des paramètres des modèles FARIMA(p,d,q) faibles. Cette technique nous permet de contourner le problème de l'estimation de la matrice de variance asymptotique de l'estimateur des moindres carrés. Nous accordons ensuite une attention particulière au problème de la validation des modèles FARIMA(p,d,q) faibles. Nous montrons que les autocorrélations résiduelles ont une distribution asymptotique normale de matrice de covariance différente de celle obtenue dans le cadre des FARIMA forts. Cela nous permet de déduire la loi asymptotique exacte des statistiques portmanteau et de proposer ainsi des versions modifiées des tests portmanteau standards de Box-Pierce et Ljung-Box. Il est connu que la distribution asymptotique des tests portmanteau est correctement approximée par un khi-deux lorsque le terme d'erreur est supposé iid. Dans le cas général, nous montrons que cette distribution asymptotique est celle d'une somme pondérée de khi-deux. Elle peut être très différente de l'approximation khi-deux usuelle du cas fort. Nous adoptons la même approche d'auto-normalisation utilisée pour la construction des intervalles de confiance des paramètres des modèles FARIMA faibles pour tester l'adéquation des modèles FARIMA(p,d,q) faibles. Cette méthode a l'avantage de contourner le problème de l'estimation de la matrice de variance asymptotique du vecteur joint de l'estimateur des moindres carrés et des autocovariances empiriques du bruit. -
Christopher Fragneau
High dimensional estimation in the monotone single-index model
1 mars 2021 - 13:00Web-séminaire
I study the monotone single-index model which assumes that a real variable $Y$ is linked to a $d$ dimensional real vector $X$ through the relationship $E[Y|X] = \Psi_0(\alpha_0^TX)$ a.s., where the real monotonic function $\Psi_0$ and $\alpha_0$ are unknown. This model is well-known in economics, medecine and biostatistics where the monotonicity of $\Psi_0$ appears naturally. Given $n$ replications of $(X,Y)$ and assuming that $\alpha_0$ belongs to $S$, the $d$ unit dimensional sphere, my aim is to estimate $(\alpha_0,\Psi_0)$ in the high dimensional context, where $d$ is allowed to depend on $n$ and to grow to infinity with $n$. To address this issue, I consider two different M-estimation procedures: a least-squares procedure, and a variant, which consist in minimizing an appropriate criterion over general classes ${\cal K} = F \times C$, where $F$ is a given closed subset of $S$, and $C$ is the set of all non-decreasing real valued functions. The facts that the unknown index $\alpha_0$ is bundled into the unknown ridge function, and that no smoothness assumption is made on the ridge function, make the estimation problem very challenging. With the goal of studying the asymptotic behavior of both M-estimation procedures, I first consider the population least-squares criterion $$(\alpha,\Psi) \mapsto \mathbb{M}(\alpha,\Psi):=\mathbb{E}[(\Psi_0(\alpha_0^T X)-\Psi(\alpha^T X))^2].$$ I establish the pointwise convergence over $\cal K$ of the least-squares criterion, as the sample size goes to infinity, to the population least-squares criterion. Moreover, I prove existence of minimizers of the population least-squares criterion over $\cal K$ and I study the direction of variation of this criterion in order to describe the minimizers. Second, I focus on constrained least-squares estimators over $\cal K$. In a setting where $d$ depends on $n$ and the distribution of $X$ is either bounded or sub-Gaussian, I establish the rates of convergence of the estimators of $\Psi_0(\alpha_0^T\dot)$, $\alpha_0$ and $\Psi_0$ in case where $(\alpha_0,\Psi_0) \in \cal K$, as well as the consistency of estimators of $\Psi_0(\alpha_0^T\dot)$, otherwise. A simulation study of the estimators of $\Psi_0(\alpha_0^T\dot)$, $\alpha_0$ on simulated data in case where $F$ is the set of vector of $S$ with few nonzero components, has shown good performance, particularly in terms of support recovery of $\alpha_0$. Third, I consider an estimation method of $(\alpha_0,\Psi_0)$ when $X$ is assumed to be a Gaussian vector. This method fits a mispecified linear model, and estimates its parameter vector thanks to the de-sparcified Lasso method of Zhang and Zhang (2014). I show that the resulting estimator divided by its Euclidean norm is Gaussian and converges to $\alpha_0$, at parametric rate. I provide estimators of $\Psi_0(\alpha_0^T \cdot)$ and $\Psi_0$, and I establish their rates of convergence. The advantage of this estimator as compared to the previous one is that it is less computationaly expensive and it requires the choice of a tuning parameter and $X$ is assumed to be Gaussian. A simulation study of the estimators of $\Psi_0(\alpha_0^T\dot)$, $\alpha_0$ from both two M-estimation procedures on simulated data has shown good performance, particularly in terms of support recovery of $\alpha_0$. -
Guillermo Durand
Contrôle post hoc des faux positifs pour des hypothèses structurées
15 mars 2021 - 13:00Web-séminaire
Dans un contexte d'analyse exploratoire, on cherche à construire des bornes de confiance sur le nombre de faux positifs présents dans n'importe quel ensemble d'hypothèses sélectionnées, avec un contrôle uniforme sur ces ensembles. Après un rappel de la méthode générale de Blanchard et al. 2020 pour construire de telles bornes à l'aide de familles de référence, on propose un nouveau type de famille de référence conçu pour capturer une structure spatiale du signal. Des simulations justifient l'approche en la comparant à la borne "Simes" de Blanchard et al. 2020. Travail réalisé en collaboration avec Gilles Blanchard, Pierre Neuvial et Etienne Roquain. -
Marius Soltane
Estimation rapide et asymtotiquement efficace pour des processus gaussiens stationnaires
22 mars 2021 - 13:00Web-séminaire
Les processus gaussiens stationnaires sont très utilisés dans diverses modélisations de phénomènes aléatoires et plus particulièrement en finance. L’inférence statistique pour de tels processus est bien connue et repose souvent sur l’utilisation du maximum de vraisemblance ou bien de la méthode de Whittle pour lesquelles la variance asymptotique est optimale. Ces méthodes sont généralement assez compliquées à mettre en œuvre et conduisent à des procédures très coûteuses sur le plan computationnel voire impossible à appliquer sur des grands échantillons. Nous proposons au cours de cet exposé de présenter une procédure statistique peu coûteuse sur le plan computationnel dont les propriétés asymptotiques sont analogues à celles des méthodes précitées (en terme de vitesse et de variance asymptotique). La procédure en question consiste à appliquer une méthode dite one-step sur un estimateur initial facile à implémenter et vérifiant une certaine condition sur sa vitesse de convergence. Nous illustrons pour finir les performances de cette méthode via des simulations sur un exemple. -
Radu Stoica
Structures and patterns in spatial data through probabilistic modelling and statistical inference
29 mars 2021 - 13:00Web-séminaire
Spatial data are sets of observations made of elements having two components. The first component gives the coordinates where the observation took place. The second component, represented usually by a multi-dimensional real vector, represents the measures associated at the corresponding location. Digital images, environmental data in epidemiology or catalogues of celestial bodies in astronomy are some typical examples of spatial data. The spatial character of the data induces a strong morphological component to the possible answers that may be given to questions arising from the data analysis. This explains why the question almost always arising is what is the pattern hidden in the data ? The main assumption of our work is that the pattern we are looking for is made of random objects that interact. Marked point processes are a probabilistic tool able to model random configurations of interacting objects. The main difficulty with these models is that they do not always exhibit a precise analytical form for their normalising constants. Hence sampling from such a probability density requires adapted MCMC simulation. Within this framework, statistical inference can be done,using methods such as the simulated annealing algorithm, the Monte Carlo maximum likelihood, ABC inference, permutation tests and bootstrap methods. The aim of this talk is to introduce marked point processes and to illustrate their applications with examples and data sets coming from : cosmology, image analysis and environmental sciences. -
Marc Hallin
Fully Distribution-Free Center-Outward Rank Tests for Multiple-Output Regression and MANOVA
24 mai 2021 - 13:00Web-séminaire
Extending rank-based inference to a multivariate setting such as multiple-output regression or MANOVA with unspecified $d$-dimen\-sional error density has remained an open problem for more than half a century. None of the many solutions proposed so far is enjoying the combination of distribution-freeness and efficiency that makes rank-based inference a successful tool in the univariate setting. A concept of {\it center-outward} multivariate ranks and signs based on measure transportation ideas has been introduced recently. Center-outward ranks and signs are not only distribution-free but achieve in dimension $d>1$ the (essential) maximal ancillarity property of traditional univariate ranks, hence carry all the ``distribution-free information" available in the sample. We derive here the H\' ajek representation and asymptotic normality results required in the construction of center-outward rank tests for multiple-output regression and MANOVA. When based on appropriate spherical scores, these fully distribution-free tests achieve parametric efficiency in the corresponding models. -
Julie Delon
Une distance de Wasserstein entre mélanges de gaussiennes et quelques applications en traitement d'image
7 juin 2021 - 13:00Web-séminaire
Les modèles de mélanges de gaussiennes (GMM) s’avèrent particulièrement utiles pour représenter des distributions de probabilité complexes de données réelles. Par exemple, en traitement d’images, de nombreux travaux utilisent des GMM pour représenter des distributions de patchs dans les images, et ces modèles sont utilisés comme a priori pour la restauration d’image ou la synthèse de texture. Le transport optimal et les distances de Wasserstein sont aujourd’hui massivement utilisés pour analyser des statistiques extraites des images ou comme métriques en apprentissage profond. Si le transport optimal peut être utilisé pour définir des géodésiques entre GMM, les interpolées ainsi définies ne conservent pas la propriété d’être des mélanges de gaussiennes. Afin de conserver cette propriété, nous définissons une nouvelle distance entre mélanges en restreignant l’ensemble des mesures de couplage à des GMM dans la formulation originale du transport optimal. De manière surprenante, on montre que cette distance entre mélanges peut se réécrire sous la forme d’un problème de transport discret, ce qui la rend simple à calculer même en grande dimension. On étudie ses propriétés, le problème multi-marginal associé et les barycentres pour cette formulation. On illustre son utilisation en traitement d’images. -
Davide Giraudo
Processus empirique basé sur des U-statistiques à deux échantillons
7 décembre 2021 - 10:30Salle de séminaire 418
Après avoir introduit les U-statistiques à deux échantillons, nous présenterons une version empirique de ces-dernières. Ceci permet de détecter un potentiel changement de loi dans un échantillon. Nous allons donner des conditions suffisantes pour la convergence des U-statistiques à deux échantillons dans un espace fonctionnel approprié ainsi qu'une description du processus limite. Il s'agit d'un travail réalisé en collaboration avec Herold Dehling (Ruhr-Universität Bochum) et Olimjon Sharipov (National University of Uzbekistan).