Le Monde des Utilisateurs de L'Analyse de Données

Numéro 41

 
 

Richesse et complexité des données fonctionnelles. Jean Frédéric FERRATY, Philippe VIEU. La revue MODULAD, numéro 43, 2011.

Résumé
Les progrés récents en matière de stockage et de traitement des données se traduisent de plus en plus fréquemment dans de nombreux domaines scientifiques par la présence de données de type fonctionnel (courbes, images, ...). Les défis proposés aux statisticiens pour appréhender ce type de données ont abouti depuis quelques années à la construction de nombreuses méthodes statistiques. Il se trouve que la complexité de ce type de données amène une richesse d'information qu'une méthode statistique (aussi sophistiquée soit elle) arrive difficilement à capter, tandis que des techniques de boosting capables d'utiliser les complémentarités de différentes méthodes se révèlent souvent plus performantes. L'objectif de ce travail est d'illustrer ce point de vue au travers d'un problème couramment rencontré en pratique: celui de la prévision d'une variable réponse réelle à partir d'une variable explicative fonctionnelle. Un rapide tour d'horizon des méthodes habituellement utilisées sera effectué, et leur complémentarité sera mise en évidence au travers d'un jeu de données issu d'un problème de chimie quantitative.

Mots clés 
Analyse de données fonctionnelles, Boosting,  Méthodes de sélection, Modèles fonctionnels, Régression,  Spectrométrie, Statistique non-paramétrique.

Article