event

Séminaire Statistique

organisé par l'équipe Statistique

  • Théorèmes limites pour des intégrales multiples par rapport au processus empirique

    — Hélène Boistard

    15 janvier 2008 - 14:15Salle de séminaire 418

  • Bootstrap pour un plan de sondage à entropie maximale

    — Guillaume Chauvet

    22 janvier 2008 - 14:15Salle de séminaire 418

  • Méthode de l'enveloppe du risque et estimation linéaire

    — Clément Marteau

    5 février 2008 - 14:15Salle de séminaire 418

    Nous nous intéresserons dans cet exposé à la résolution de problèmes inverses statistiques: on cherche à estimer une fonction (ou un signal) à partir d'observations indirectes et bruitées. L'approche utilisée est du type "sélection de modèle": étant donnée une famille d'estimateur, le but est de construire un algorithme (adaptatif) permettant de selectionner le meilleur possible. Dans cette situation, la méthode d'estimation du risque sans biais (URE en anglais) donne de très bons résultats théoriques mais s'avère très instable d'un point de vue numérique. L. Cavalier et Y. Golubev ont proposé plus récemment une méthode dite de minimisation d'une enveloppe du risque (RHM en anglais) qui améliore significativement les performances de la procédure URE dans le cadre d'une estimation par projection. Utilisant des résultats récents sur la théorie des processus ordonnés, nous verrons comment généraliser cette méthode à des familles plus larges d'estimateurs.
  • La modélisation espace état et la prédiction

    — Mohammed Debbarh

    12 février 2008 - 14:15Salle de séminaire 418

  • Régression non paramétrique en présence de données censurées

    — Viallon Vivian

    18 mars 2008 - 14:15Salle de séminaire 418

  • Modélisation de tous les excès au dessus d'un seuil à partir d'une structure de dépendance extrême. Applications sur les débits extrêmes.

    — Mathieu Ribatet

    25 mars 2008 - 14:15Salle de séminaire 418

  • Inférence de réseaux bayésiens dynamiques homogènes par morceaux/ /par MCMC à sauts réversibles

    — Sophie Lebre

    25 mars 2008 - 15:30Salle de séminaire 418

    Attention, ce mardi, il y aura deux séminaires de statistique.
  • A new test of independence in some copula models

    — Salim Bouzebda

    1 avril 2008 - 14:15Salle de séminaire 418

  • Propriétés asymptotiques d'un estimateur du quantile conditionnel pour des données tronquées.

    — Nicolas Poulin

    1 avril 2008 - 15:30Salle de séminaire 418

    Attention, il y aura deux seminaires de statistique ce mardi 1er avril
  • Début et fin d'activités (rupture des modèles) et intervalle de confiances (par bootstrap)

    — Han Ping Li

    15 avril 2008 - 14:00Salle de séminaire 418

    Attention, le séminaire débutera a 14h et non a 14h15 exceptionnellement
  • General model selection estimation of a periodic regression with a gaussian

    — Victor Konev

    22 avril 2008 - 14:15Salle de séminaire 418

  • A priori par melange d'arbres de Polya sur copule et applications

    — Jean Luc Dortet

    20 mai 2008 - 14:15Salle de séminaire 418

  • Questions d'adaptation en statistique non-paramétrique

    — Nicolas Klutchnikov

    27 mai 2008 - 14:15Salle de séminaire 418

  • Développements d'Edgeworth de deux estimateurs d'une proportion de mesures

    — Myriam Maumy

    3 juin 2008 - 14:15Salle de séminaire 418

  • Dependence Estimation and Prediction for Max-Stable Processes

    — Dan Cooley

    10 juin 2008 - 14:15Salle de séminaire 418

    The dependence structure of a max-stable random vector or max-stable process is characterized by its spectral measure. Several dependence estimators have been suggested for max-stable random vectors, but none were particularly well- suited for max-stable processes, particularly spatial processes. We introduce the madogram as a dependence measure for extremes which has ties to work in both extreme value theory and spatial statistics. Once the level of dependence is estimated, we then turn attention to the problem of prediction. Given only the spectral measure, we present a method for approximating the conditional density of an unobserved component of a max-stable random vector given the other components of the vector. The approximated conditional density can be used for prediction. We also present a new parametric model for the spectral measure of a multivariate max- stable distribution. This model is used to perform prediction for both a time series and spatial process.
  • Une approche par copules de l'estimation non paramétrique de la densité conditionnelle

    — Olivier Faugeras

    30 septembre 2008 - 14:15Salle de séminaire 418

    Nous présentons un nouvel estimateur non paramétrique à noyau de la densité conditionnelle bivariée. Il est basé sur une transformation efficace des données par transformation de quantile. L'utilisation de la fonction de copule permet alors d'avoir une estimateur qui a une remarquable forme en produit, alors que les estimateurs basés sur la régression de type Nadaraya-Watson ont une forme en quotient. Nous étudions ses propriétés asymptotiques et comparons son biais et sa variance aux estimateurs concurrents. Une simulation numérique vient compléter cette étude. Enfin, nous évoquons brièvement quelques perspectives et applications, notamment aux valeurs extrêmes
  • Données manquantes en tableaux multiples

    — Julie Josse

    7 octobre 2008 - 14:15Salle de séminaire 418

    La gestion des données manquantes est un problème incontournable dans la pratique statistique. L'objectif de cet exposé est de présenter comment réaliser une Analyse Factorielle Multiple sur données incomplètes. Nous nous situons dans un contexte d'analyse de données avec une structure de données particulière (tableaux multiples) et une structure de données manquantes particulières (lignes manquantes par sous-tableaux). Le coeur de l'AFM étant une ACP pondérée, nous présentons dans un premier temps, dans un cadre unique, différentes méthodes permettant de réaliser une ACP sur données incomplètes. Nous exposons ensuite une méthode d'AFM itérative pour obtenir les axes et composantes de l'AFM en présence de données manquantes. Nous terminons enfin par des simulations et un exemple réel pour illustrer cette méthode.
  • Un modèle d'évolution des séquences d'ADN avec dépendance au contexte

    — Audrey Finkler

    21 octobre 2008 - 14:15Salle de séminaire 418

    Les modèles évolutifs actuels sont des modèles markoviens à temps continu qui posent l'hypothèse que les sites d'une séquence d'ADN évoluent de façon indépendante. Cette hypothèse n'a cependant pas de justification biologique, notamment à cause de forts taux de transition à partir des di-nucléotides CpG. Je présente ici un modèle simple qui combine un processus de dépendance temporelle unilatérale avec une chaîne de Markov spatiale. Ce modèle peut s'écrire sous la forme d'une chaîne de Markov cachée, dont j'estime les paramètres à l'aide de l'algorithme EM.
  • Comparaison de la variabilité d'ARNm chez des sujets cancéreux et des sujets sains

    — Olivier Collignon

    28 octobre 2008 - 14:15Salle de séminaire 418

    Les gènes se situent sur l'ADN, qui est le support de l'information génétique. Chaque gène peut être représenté par une suite de lettres A,T,C ou G de longueur variable, et est ''le plan de fabrication'' d'une protéine. Cette synthèse nécessite l'intervention d'une molécule intermédiaire, l'ARNm. Cette dernière est produite à partir de l'ADN par complémentarité : A est changé en U, T en A, C en G et G en C. Ce mécanisme est appelé transcription et est supposé fidèle. Pour comparer les ARNm issus de patients cancéreux et ceux issus de patients sains, on utilise des copies partielles des ARNm appelées EST. On observe en pratique que sur ces copies certaines lettres sont remplacées par erreur par une lettre différente. Ainsi soit ces erreurs sont dues au séquençage (i.e. à la fabrication des EST), soit la fidélité de la transcription est remise en cause. On met alors en place un modèle statistique pour comparer la variabilité des EST cancéreux et des EST sains. On montre alors que cette variabilité est en général significativement plus élevée dans le cas cancer que dans le cas normal, et que cette variabilité n'est pas due aux erreurs de séquençage. On introduit alors le concept d'infidélié de transcription.
  • Estimation non paramétrique pour les modèles autorégressifs

    — Ouerdia Arkoun

    18 novembre 2008 - 14:15Salle de séminaire 418

    Cet exposé portera sur un problème d'estimation non paramétrique en un point donné fixé pour un modèle autorégressif. Des modifications de l'estimateur à noyau sont proposées et on montre les propriétés d'efficacité asymptotiques pour cet estimateur.
  • Moments ponderes generalises en theorie des valeurs extremes

    — Pierre Ribereau

    25 novembre 2008 - 14:15Salle de séminaire 418