Discuter:Processus stationnaire

Un article de Wikipédia, l'encyclopédie libre.

Pourquoi cette notion est-elle jugée d'importance plus faible que la notion de processus continu alors qu'il s'agit des processus continus les plus utilisés ? A dire vrai, ces deux notions sont plus utiles en physique qu'en mathématiques. Jct (d) 4 février 2008 à 15:00 (CET)

De fait, en mathématiques, la notion de processus continu semble plus importante que les autres qui sont moins connus. C'est bien possible que ce soit le contraire en physique. Ambigraphe, le 4 février 2008 à 15:25 (CET)

[modifier] Processus stationnaire et Stationnarité d'une série temporelle

Un lien (justifié) vient d'être inséré vers Stationnarité d'une série temporelle. Il me semble néanmoins que la fusion des deux articles n'est pas évidente étant donnée la différence de points de vue.

L'article sur les séries temporelles prétend à une rigueur mathématique qui a été délibérément exclue dans le présent article mais celui-ci pourrait évidemment être amélioré sur ce point. Autre problème, plus délicat, une série est discrète tandis que l'article discuté porte sur un processus continu. Là encore, il serait possible de jongler avec les êtres mathématiques.

Le vrai problème, c'est qu'un processus est beaucoup plus qu'une série (voir Processus stochastique et Processus continu). C'est un ensemble de séries qu'on interprète en associant la stationnarité (notion temporelle) à l'ergodicité (notion statistique). Il est même souvent intéressant d'interpréter les caractéristiques temporelles en termes de fréquences (voir Analyse spectrale).

Il faut donc, me semble-t-il, aller plus loin que la mention Article détaillé qui est, pour le moins, très imprécise mais sans aller jusqu'à la fusion qui me paraît très difficile (l'intersection de deux notions ne contient qu'une faible partie de celles-ci). Jct (d) 6 juin 2008 à 10:47 (CEST)

Jct soulève beaucoup de points très justes qui justifient la séparation entre les deux articles. Je crois effectivement que je devais faire certaines confusion entre séries et processus, même si au final ces deux termes se rejoignent peut-être. Il faut effectivement faire la différence entre processus en temps discret ou temps continu, à valeurs discrètes ou continues, et analyse dans le domaine du temps ou de la fréquence (qui concernent tous deux des séries temporelles!). Par contre, même si l'article Stationnarité d'une série temporelle parle de série temporelle, il s'applique bien, (je crois?) aux processus temporels également. J'aurais envie de dire que série et processus parlent recouvrent le même objet mais une fois dans une approche statistique (série) et une fois probabiliste (processus). Par exemple, un mouvement auto-regréssif serait bien un processus mais les données observées (qui suivraient un processus stationnaire ou non) seraient traitées comme des séries. Parler effectivement de fonction de densité pour une série n'a pas de sens.
Peut-être qu'en définissant clairement (si c'est pertinent) entre temps discret/continu, domaine du temps/fréquence, on pourrait clarifier la chose et arriver à une mention plus juste que Article détaillé. De même, le titre de Stationnarité d'une série temporelle pourrait être changé, cet article décrit des phénomènes à valeur continues en temps discret. La définition de processus stationnaire est (je crois?) de valeurs continues et en temps continu. Mais les deux définitions sont dans le domaine du temps.
J'ai également modifié la page stationnarité (idem que stationnaire) et j'aurais volontiers votre avis Merci!
Finalement, peut être serait-ce l'occasion de modifier la page séries temporelles en rajoutant ces distinctions temps7fréquence, discret/continu.. un projet que j'ai eu mais jamais pu réaliser... EtudiantEco (d) 6 juin 2008 à 15:03 (CEST)
Il paraît raisonnable de remplacer la mention Article détaillé : Définition de la stationnarité d'une série temporelle par quelque chose dans l'introduction comme En économie, une notion analogue est utilisée pour des processus discrets (voir Stationnarité d'une série temporelle).
Une série temporelle n'est pas différente par essence d'un signal continu qui, de nos jours, est numérisé avant tout traitement. La différence concerne plutôt les problèmes considérés. L'article Processus stochastique aborde à la fois les processus continus et les processus markoviens qui sont généralement (pas toujours) discrets. Dans ces conditions, il paraît normal d'y inclure une référence aux séries temporelles. Jct (d) 9 juin 2008 à 09:34 (CEST)
Le renvoi semble effectivement plus approprié. Par rapport à la référence à l'économie, je ne crois pas (même si tu as tout à fait raison quant à son application) que la définition soit propre à l'économie (la définition est tirée du livre de Hamilton Time Series analysis). Est-ce qu'un renvoi du type: pour une définition analogue de la stationnarité pour des processus/séries en temps discret voir Stationnarité d'une série temporelle dans l'intro te semble plus bon aussi, vu qu'il y est précisé que l'article parle de processus continus? Et inversement sur la page de Stationnarité d'une série temporelle?

--Jct (d) 12 juin 2008 à 12:40 (CEST)== Commentaires ==

La statistique descriptive porte sur des ensembles de nombres appelés populations finies. Elle permet de leur associer des réductions statistiques (moyenne, variance, etc.) Dans certains cas, il est commode de considérer que ces données sont plus ou moins représentatives d'une population plus importante qu'on peut supposer infinie, chaque valeur connue étant considérée comme une réalisation d'une variable aléatoire, c'est le domaine de la statistique mathématique ou inférence statistique. (Pour quelques informations complémentaires voir Statistiques#Statistique descriptive et statistique mathématique.)

Des notions analogues se rencontrent à propos des séries temporelles et des enregistrements de signaux continus. Ces données portant sur une durée finie peuvent également fournir des informations synthétiques de même nature qu'une population finie plus, par exemple, une période moyenne. Là aussi, on peut aller plus loin en considérant une série temporelle comme une réalisation d'un processus stochastique (ou processus aléatoire ou fonction aléatoire).

Ce point de vue est notablement simplifié si le processus peut être supposé stationnaire, les moyennes calculées à un instant donné sur toutes les réalisations devant être indépendantes de l'instant considéré. L'ennui, c'est qu'il est facile de mettre en évidence cette propriété à partir d'une équation ou de la génération par ordinateur d'un grand nombre de réalisations mais c'est beaucoup plus difficile dans un problème concret.

Pour prendre un exemple, selon les normes habituelles un enregistrement d'un état de mer dure 20 minutes environ, ce qui correspond à une ou deux centaines de vagues. Cette durée est jugée assez courte pour assurer en général la stationnarité. Il est en effet peu probable (sans plus) que les conditions météo aient été significativement changées. Elle est également assez longue pour fournir des informations statistiques (jugées) acceptables. Moyennant quoi, on peut obtenir une estimation de la densité spectrale. Celle-ci permet de déduire ensuite des estimations des caractéristiques statistiques de la réponse d'un système donné à cet état de mer.

La notion de stationnarité en économie me paraît plus mystérieuse (probablement le résultat de mon incompétence). En premier lieu, elle intervient dans un problème beaucoup plus délicat que les nombreux problèmes analogues au précédent : la prédiction. Peut-être ce problème n'a-t-il pas été étudié faute d'applications mais j'ai du mal à voir comment la connaissance de cent vagues peut fournir des informations pertinentes sur la cent unième. Ensuite, pour affirmer qu'une série temporelle peut être considérée comme une réalisation d'un processus (probablement) stationnaire il faut (me semble-t-il) faire au moins un raisonnement sommaire comme celui qui concerne les vagues. Comment peut-il être esquivé en affirmant que si une série temporelle n'est pas stationnaire, il est possible de la rendre stationnaire en la différentiant (Stationnarité d'une série temporelle) ?

Même si certaines affirmations précédentes peuvent être contestées, il paraît difficile de fusionner la description approximative du passé avec la prédiction de l'avenir. Jct (d) 9 juin 2008 à 09:34 (CEST)

Grâce à tes suggestions, j'ai pu améliorer la page stationnarité. Il est effectivement faux d'affirmer que si une série temporelle n'est pas stationnaire, il est possible de la rendre stationnaire en la différentiant.
J'ai également rajouté une section qui décrit l'importance de la notion, en ajoutant d'autres applications que la prédiction. Pour l'utilisation en économie, tu as raison de critiquer la démarche de la prédiction, du moins dans sa forme la plus simple. Mais pour reprendre ton exemple des vagues, peut-être suis-je trop contaminé par la vision déterministe économique mais le fait que la série (et c'est bien une série en l'occurrence!) des informations sur les 100 premières vagues est stationnaire permet de mieux déterminer l'intervalle de prédiction de la prochaine vague que si la série est non-stationnaire. Ceci dit, la stationnarité est également utilisée dans tous les modèles temporels où on ne fait qu'étudier le passé.
Néanmoins, je pense que tu as raison de garder la différence entre ces pages, en essayant de voir cependant quelles sont les différences et comment on peut rédiger la page de redirection de stationnarité. Peut-être faut-il également réfléchie si il ne faut pas changer le titre des pages avec une fois la mention de temps discret et une fois de temps continu pour un maximum de clarté?
Je vais tenter d'être plus précis. Contrairement à ce que laissait croire maladroitement ma première intervention, il n'y a pas de différence au niveau du calcul entre un processus discret et un processus continu une fois numérisé, même si les formules peuvent s'expliciter différemment. Au delà des formules, la différence évidente qui impose d'écrire deux articles distincts se situe entre la description d'un phénomène passé et la prédiction de l'avenir.
En fait je suis d'accord avec toi pour le fait qu'il n'y ait pa de fusion, mais pas pour les mêmes raisons :-) La différence entre un phénomène passé et la prédiction de l'avenir ne correspond à mon avis pas du tout à la différence entre les deux pages... il est tout à fait possible d'utiliser les mêmes âneries qui sont faites dans la prédiction en économie avec des processus continus! De plus, la notion de stationnarité est utilisées dans d'autres domaines en économie, j'ai commencé à le montrer dans une nouvelle section que j'espère compléter, et surtout créé une nouvelle page qui montre le gros problème de Régression fallacieuse et donc l'importance capital de la notion de stationnarité même pour décrire le passé! Quant à la notion de série/processus, je crois effectivement qu'elle est réglée, surtout en pensant au concept de Data Generating process, qui résume bien cela. Je crois pour finir que la vraie différence entre les articles réside dans le fait que les phénomènes soient traités en temps discret (Stationnarité d'une série temporelle) ou continu (processus stationnaire), et que nous devrions partir de cela pour mieux faire la différence et réfléchir à la formulation de la page de redirection. EtudiantEco (d) 11 juin 2008 à 18:20 (CEST)
Au risque de lasser, je maintiens qu'il n'y a pas de différence essentielle entre un processus discret et un processus continu qui, pour des raisons informatiques, est nécessairement discrétisé. (Cette discussion a au moins un avantage, je m'aperçois que la distinction discret/continu n'a pas la pertinence que je lui prêtais lorsque je l'ai malheureusement introduite dans l'article Processus stochastique.) Par ailleurs, cet article renvoie aux processus de Markov qui sont généralement discrets mais apparaissent sous la forme continue dans l'équation de Fokker-Planck. Pour revenir à des notions plus terre à terre, j'aimerais savoir en quoi les processus que l'on peut associer aux débits de rivières (j'ai tendance à croire que, pour des raisons pratiques, le mot continu n'a jamais été utilisé) sont assez différents des processus associés aux phénomènes économiques pour ne pas aller plus loin qu'un survol de l'article qui précise la notion de stationnarité.
Le fond du problème, c'est que la stationnarité ne porte pas sur des données, qu'on parle de signaux ou de séries temporelles. Comme le disent implicitement les deux définitions présentées dans Stationnarité d'une série temporelle, elle porte sur des processus abstraits bâtis autour des données (une espérance ne se calcule pas sur les valeurs observées successivement mais sur toutes les réalisations possibles de la variable aléatoire à un instant donné). Je commencerais peut-être à comprendre si on m'expliquait comment les tests de stationnarité se réfèrent aux processus et non aux seules données disponibles. L'introduction de l'article essaie maintenant (conséquence positive de notre controverse) de montrer quel type de « raisonnement » conduit à accepter l'hypothèse stationnaire dans les domaines techniques. Le raisonnement effectué à propos des séries temporelles m'intéresse. Peut-être arrivera-t-il à me convaincre de ce que la stationnarité des séries temporelles a quelque chose de commun avec celle des processus bâtis autour des signaux. En attendant ces éclaircissements, je suis obligé de considérer qu'elles n'ont rien de commun.
Comme dit précédemment, l'opposition discret/continu ne clarifie rien, l'opposition temps/fréquence étant encore moins pertinente puisque, pour un processus stationnaire, l'autocorrélation et la densité spectrale constituent une paire de Fourier.
Autre point que j'aurais dû relever plus tôt, la controverse aurait pu (?) être moins confuse : J'aurais envie de dire que série et processus parlent recouvrent le même objet mais une fois dans une approche statistique (série) et une fois probabiliste (processus). Ils ne recouvrent pas du tout le même objet : il peut être (éventuellement) intéressant de considérer la série comme une réalisation (certaine) d'un processus aléatoire de même qu'une observation isolée peut être considérée comme une réalisation (certaine) d'une variable aléatoire, ni plus, ni moins. La terminologie ne facilite pas les choses : une série temporelle est-elle un ensemble ordonné de valeurs ou le processus aléatoire associé à celle-ci ? Parler effectivement de fonction de densité pour une série n'a pas de sens. Pourquoi ?
Remarque secondaire. L'article sur la régression fallacieuse est beaucoup trop savant pour moi (ou trop concis ?). En m'en tenant à des notions naïves, j'ai du mal à comprendre comment une forte corrélation peut faire croire à une relation entre les variables qui n'est en fait que fallacieuse. Jct (d) 12 juin 2008 à 12:40 (CEST)
Tout tourne autour des notions de stationnarité/non stationnarité. Celles-ci doivent être précisées, particulièrement lorsqu'on prétend « prévoir le PIB français en 2020 » (Séries temporelles). Dans les lignes qui précèdent j'ai tenté de montrer comment la notion de processus aléatoire stationnaire fournissait une description d'un phénomène à condition de montrer par un raisonnement, grossier en l'occurence, que l'hypothèse de stationnarité était acceptable. Est-ce que des raisonnements analogues sont effectués avant de se livrer à une prédiction pour montrer que chaque observation peut être considérée comme une réalisation d'une loi de probabilité indépendante du temps ? Il semble que ce soit le cas puisque « Comme la loi de probailité d'une distribution d'une série de données est très difficile à estimer, une définition moins stricte de la stationnarité a été introduite. »
Parti à la pêche avec Google, j'ai ferré un article qui me semble intéressant,[[1]] Preprint. Cet article technique porte sur les débits d'une rivière, qui ne sont généralement pas mesurés en continu, et considère donc des séries temporelles plutôt que des signaux continus. L'auteur discute de manière approfondie les notions de stationnarité/non stationnarité et de « trend ». En particulier il fait remarquer que ce fameux trend peut être nul sur une décennie, non nul sur un siècle et remplacé par des variations plus complexes sur un millénaire. De manière plus cocasse il se demande en quoi ce trend, résultat d'un calcul statistique, est plus déterministe qu'une variation entre deux mesures consécutives. Allant plus loin, il affirme que pour introduire un trend déterministe il faut avoir une idée extérieure aux données considérées, ce qui résume bien le fond de mes remarques.
Jct (d) 10 juin 2008 à 12:12 (CEST)
L'article était intéressant, merci! Je ne l'ai cependant que survolé mais je tiens juste à mentionner qu'un des buts de l'étude de la stationnarité est de faire la différence entre trend déterministe et trend stochastique, distinction que je n'ai pas (encore) pu expliciter sur la page. EtudiantEco (d) 11 juin 2008 à 18:20 (CEST)

[modifier] Tentative de conciliation

Je crois commencer à comprendre. Il est souvent commode d'interpréter une série temporelle (ou un signal) à l'aide d'un processus aléatoire dont elle (ou il) est une réalisation parmi d'autres. C'est particulièrement efficace si on peut considérer ce processus comme stationnaire, c'est-à-dire si les moyennes d'ensembles (espérances mathématiques) ne dépendent pas de l'instant où elles sont calculées. L'ennui c'est que, sauf exception, les données à analyser constituent la seule réalisation connue du processus, ce qui est peu pour calculer des moyennes à un instant donné.

Lorsqu'on raisonne sur un signal physique, il est souvent possible de faire l'hypothèse selon laquelle les conditions changent peu si la durée d'enregistrement est assez faible. On accède ainsi à une stationnarité approximative qui se paie par des incertitudes liées au nombre de données trop réduit. Lorsque ce n'est pas possible, la considération d'un processus non stationnaire se paie par la nécessité impérative d'obtenir un certain nombre de réalisations et d'utiliser des notions mathématiques plus compliquées pour les interpréter.

A ce que je comprends, pour une série temporelle ce problème est esquivé en tentant de juger de la stationnarité du processus à travers une seule réalisation. Ceci exige l'utilisation de modèles qui mélangent des termes déterministes, linéaires ou non, et des termes aléatoires, stationnaires ou non. Cette démarche, qui ignore a priori les mécanismes sous-jacents, me paraît plus risquée que la précédente. Jct (d) 13 juin 2008 à 10:10 (CEST)

Je crois effectivement qu'on arrive à une plus grande clarté: on suppose que les séries suivent un processus, qu'elles en sont les réalisations. J'ai modifié l'article des séries en conséquence, et te serais reconnaissant de me faire part de tes commentaire. Je n'ai pas encore ajouté de renvoi à la page processus stationnaire.
Pour le problème du nombre de réalisations, c'est exactement le même pour les résidus d'une régression: on ne dispose souvent que d'une observation par variable pour chaque individu, alors on suppose qu'ils ont tous indépendants et on en calcule la moyenne à partir de toutes les valeurs. Pour la transposition de ce problème aux séries temporelles en temps discrets, c'est clair qu'on ne dispose que d'une observation à chaque moment. 'tentant de juger de la stationnarité du processus à travers une seule réalisation' je ne crois pas exactement. Le fonctionnement des tests est le suivant: ceux-ci regardent si on peut assimiler le processus sous-jacent à un processus connu, dont on connait la stationnarité ou non. Ex: on regardera la probabilité que les données suivent une marche aléatoire, auquel cas elles (ou plutot le processus générateur, data generating process en anglais) est/sont stationnaires.
Peut-etre qu'il faudra songer à rajouter une nouvelle page ou compléter la page Statistiques#Statistique descriptive et statistique mathématique ou Interconnexions entre la théorie des probabilités et les statistiques. Je suis absent ce WE mais reprendrai la discussion lundi. Merci pour tes commentaires! EtudiantEco (d) 13 juin 2008 à 16:53 (CEST)
Nous avons effectivement fait un grand pas l'un vers l'autre. Les modifications apportées à Stationnarité d'une série temporelle me paraissent raisonnables (mis à part les accords qui ont souffert de la rapidité de la rédaction !). Pour chercher encore la petite bête, j'ai du mal à comprendre la phrase Comme la loi de probailité d'une distribution d'une série de données est très difficile à estimer, une définition moins stricte de la stationnarité a été introduite. Cela me ramène à mon idée fixe : à quel moment la loi de probabilité est-elle estimée ?
Il reste néanmoins quelques petits détails de vocabulaire à régler. Les tests regardent si on peut assimiler le processus sous-jacent à un processus connu, dont on connait la stationnarité ou non. Je suis bien d'accord avec cette affirmation mais ma question originale (dont la clarté a dû être améliorée au cours des échanges) était : qu'est-ce qui apporte les informations les plus fiables, l'adéquation à un modèle a priori ou à l'adéquation (nécessairement grossière) à la réalité ? Dans mes connaissances éparses en probabilités/statistiques ce qui me paraît être la règle la plus importante c'est : un calcul, même aussi élémentaire que celui d'un coefficient de corrélation, n'apporte aucune information utilisable s'il n'a pas pour but de conforter une hypothèse basée sur une connaissance du phénomène.
L'article Statistiques (en concurrence étonnante avec Statistique) est trop général pour qu'on y introduise des notions aussi particulières. Le premier alinéa d'Interconnexions entre la théorie des probabilités et les statistiques me paraît tout-à-fait pertinent mais je vois mal ce qu'il ajoute (et ce qu'il pourrait ajouter en le développant) par rapport aux liens qu'il contient. La place naturelle de ces notions me paraît se situer dans le paragraphe Processus stochastique#Pratiquement qui, à la lumière de notre discussion, doit être entièrement réécrit.
En ce qui concerne la page de redirection, je n'ai pas d'idée arrêtée sur son contenu. Je vais développer dans Discuter:Stationnarité quelques éléments (qui ne feront que tenter de préciser encore mes idées sur la stationnarité). Jct (d) 14 juin 2008 à 14:38 (CEST)