De la finance à la climatologie, en passant par les processus industriels, nombreux sont les domaines où on rencontre des séries temporelles. L'analyse, la modélisation et la prédiction de séries temporelles constituent aujourd’hui encore des défis, sur le plan scientifique tout comme dans ces nombreux domaines d’applications. En alternative aux modèles linéaires, les modèles non linéaires sont utilisés ici pour l’analyse, la modélisation et la prédiction de séries temporelles. Les modèles non linéaires sont potentiellement plus performants que les modèles linéaires, mais les questions de sélection de structure de modèle, de prédiction à long terme ou de construction des régresseurs sont plus complexes à résoudre dans le cadre non linéaire. Les paramètres de structure de certains modèles et des méthodes de sélection de structure sont d’abord décrits. La sélection de structure par FastBootrap est complétée par un test statistique qui constitue un argument théorique en faveur de l’approximation par régression linéaire du terme d’optimisme du Bootstrap. La Double Quantification Vectorielle (DQV), modèle de prédiction à long terme de séries temporelles, est introduite. La détermination des paramètres est détaillée, pour des séries scalaires et pour des séries multidimensionnelles auxquelles la DQV peut aisément être appliquée. La stabilité de la DQV en prédiction à long terme est établie théoriquement. Les capacités de la méthode sont illustrées sur divers exemples, en prédiction à court terme, à long terme, en scalaire et en multidimensionnel. La construction du régresseur est abordée lors de l’étude du caractère significatif de l'application des méthodes de clustering à des régresseurs. Une méthodologie de comparaison entre reconstructions de l’espace de phase de séries temporelles est décrite et appliquée sur plusieurs séries. Les résultats obtenus illustrent l’importance du délai dans la construction de régresseurs et permettent de prendre position dans un débat scientifique en cours : l’application des méthodes de clustering à des régresseurs a un sens. La construction du régresseur avec sélection d’un délai unique est alors généralisée au cas de plusieurs délais. Des généralisations des critères d’autocorrélation et d’information mutuelle à plus de deux variables sont proposées. Le critère géométrique de Distance à la Diagonale est également introduit. Tous ces critères de sélection de plusieurs délais sont comparés expérimentalement.
1 Introduction `a la pr´ediction de Séries temporelles 1
1.1 D´efinitions, notations et exemples . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Analyse, mod´elisation et pr´ediction . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Organisation de la th`ese et contributions . . . . . . . . . . . . . . . . . . . . 5
2 Mod`eles, s´election de structure et pr´ediction `a long terme 7
2.1 Mod`eles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.1.1 Comment s’y retrouver parmi les nombreux mod`eles? . . . . . . . . 7
2.1.2 Quantification vectorielle . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.3 Les cartes auto-organis´ees . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.4 Les r´eseaux `a fonctions radiales de base . . . . . . . . . . . . . . . . 13
2.2 S´election de structure de mod`eles . . . . . . . . . . . . . . . . . . . . . . . . 15
2.2.1 Crit`eres de mesure de l’erreur de g´en´eralisation . . . . . . . . . . . . 17
2.2.2 M´ethodes de validation et de cross-validation . . . . . . . . . . . . . 18
2.2.3 Bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
2.2.4 Fast-bootstrap . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
2.3 Pr´ediction `a long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3 Double Quantification Vectorielle 31
3.1 Pr´ediction par Double Quantification Vectorielle . . . . . . . . . . . . . . . 31
3.2 Cartes auto-organis´ees et Séries temporelles . . . . . . . . . . . . . . . . . . 32
3.3 La Double Quantification Vectorielle . . . . . . . . . . . . . . . . . . . . . . 35
3.3.1 Phase d’apprentissage . . . . . . . . . . . . . . . . . . . . . . . . . . 35
3.3.2 Phase de pr´ediction . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3.3.3 Pr´ediction `a long terme par Double Quantification Vectorielle . . . . 39
3.4 Commentaires sur la Double Quantification Vectorielle . . . . . . . . . . . . 41
3.5 Stabilit´e `a long terme de la Double Quantification Vectorielle . . . . . . . . 42
3.5.1 Rappels sur les chaˆınes deMarkov . . . . . . . . . . . . . . . . . . . 43
3.5.2 Preuve de stabilit´e `a long terme . . . . . . . . . . . . . . . . . . . . 45
3.5.3 Port´ee du r´esultat de stabilit´e . . . . . . . . . . . . . . . . . . . . . . 54
3.6 Applications . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.6.1 Santa Fe A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.6.2 Série polonaise ´electrique . . . . . . . . . . . . . . . . . . . . . . . . 59
3.6.3 CATS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.7 Pr´ediction r´ecursive, pr´ediction directe : discussion sur les performances `a long terme . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.8 M´ethodes proches de la Double Quantification Vectorielle . . . . . . . . . . 68
3.8.1 Double Quantification et RBFN locaux . . . . . . . . . . . . . . . . 68
3.8.2 DoubleMatrice des Transitions . . . . . . . . . . . . . . . . . . . . . 69
3.9 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
4 L’importance de la s´election du d´elai dans la construction de r´egresseurs 75
4.1 Analyse de Séries temporelles . . . . . . . . . . . . . . . . . . . . . . . . . . 75
4.2 Construction de r´egresseurs et choix du d´elai . . . . . . . . . . . . . . . . . 76
4.3 Le clustering de r´egresseurs est-il significatif? . . . . . . . . . . . . . . . . . 77
4.4 Crit`eres de comparaison pour distributions de prototypes . . . . . . . . . . 79
4.5 Comparaison de distributions de prototypes . . . . . . . . . . . . . . . . . . 81
4.6 Distance `a la Diagonale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.7 S´election de d´elai et comparaison de distributions de prototypes . . . . . . . 88
4.8 Caract`ere significatif du clustering : enseignements . . . . . . . . . . . . . . 90
4.9 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5 S´election du d´elai en haute dimension 93
5.1 Reconstruction de l’espace de phase : la th´eorie . . . . . . . . . . . . . . . . 93
5.1.1 D´efinitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.1.2 Th´eor`emes fondamentaux . . . . . . . . . . . . . . . . . . . . . . . . 94
5.1.3 M´ethodes d’estimation de la dimension intrins`eque . . . . . . . . . . 95
5.2 S´election du d´elai . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.2.1 S´election lin´eaire du d´elai par autocorr´elation . . . . . . . . . . . . . 98
5.2.2 S´election non lin´eaire du d´elai par information mutuelle . . . . . . . 99
5.2.3 Vers une g´en´eralisation de l’autocorr´elation et de l’information mutuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
5.3 Autocorr´elation et information mutuelle `a deux variables : les limites . . . . 102
5.4 D´elai par autocorr´elation d’ordre sup´erieur . . . . . . . . . . . . . . . . . . 105
5.5 D´elai par information mutuelle en haute dimension . . . . . . . . . . . . . . 107
5.6 D´elai par Distance `a la Diagonale . . . . . . . . . . . . . . . . . . . . . . . . 111
5.7 S´election multiple de d´elais . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
5.7.1 Comparaison en termes de d´elais s´electionn´es . . . . . . . . . . . . . 114
5.7.2 Comparaison en termes de pr´ediction . . . . . . . . . . . . . . . . . 120
5.7.3 Analyse des observations . . . . . . . . . . . . . . . . . . . . . . . . . 121
5.7.4 En pratique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
5.8 R´esum´e du chapitre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 124
6 Conclusion et perspectives 127
A Séries temporelles utilis´ees 131
A.1 Série SunSpot . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
A.2 Série Santa Fe A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
A.3 Série Polonaise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
A.4 Série CATS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
A.5 Série Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
A.6 Série MarcheAl´eatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
A.7 Série Rossler . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
A.8 Série AR3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 136
Liste des publications 137
R´ef´erences 140