Utilisateur:Lehalle/formulaire

Un article de Wikipédia, l'encyclopédie libre.

Lehalle   Chez moi   Bloc notes   Formulaire   Décompressions   Contributions
Portail Proba stat

Un bon moyen d'avoir des formules sous la main...

Sommaire

[modifier] Dynamique du genre recuit

[modifier] Notations et définitions

Nous avons deux densités de probabilités f_B^{(t)}(x) et f_W^{(t)}(x) à l'instant t sur un espace probabilisé (Ω,dx) et un noyau Kr(x,y) de rayon r sur \Omega\times\Omega.

Définissons à chaque instant t le Kr-déséquilibre autour x entre les classes B et W par:

D^{(t)}(x) = {\displaystyle \int_{y\in \Omega} f_B^{(t)}(y) K_r(x,y)\, dy\over \displaystyle \int_{y\in \Omega} \left(f_B^{(t)}(y)+f_W^{(t)}(y)\right) K_r(x,y)\, dy}

Le Kr-déséquilibre moyen est donc:

D^{(t)}_W = {\displaystyle \int_{x\in\Omega}\int_{y\in \Omega} f_B^{(t)}(y) K_r(x,y) f_W^{(t)}(x) \, dy\, dx\over \displaystyle \int_{y\in \Omega} \left(f_B^{(t)}(y)+f_W^{(t)}(y)\right) K_r(x,y)\, dy}

Et créons la dynamique (on peut prendre comme point initial les f_\cdot^{(0)} uniformes sur Ω):

f_W^{(t+1)}(x) = { \displaystyle f_W^{(t)}(x) \cdot e^{ -\,D^{(t)}(x)} \over \displaystyle \int_{u\in \Omega} f_W^{(t)}(u) \cdot e^{ -\,D^{(t)}(u)} \,du} \,,\; f_B^{(t+1)}(x) = { \displaystyle f_B^{(t)}(x) \cdot e^{ -\,(1-D^{(t)}(x)} )\over \displaystyle \int_{u\in \Omega} f_B^{(t)}(u) \cdot e^{ -\,(1- D^{(t)}(u)}) \,du}

[modifier] Premières remarques

Kr est un noyau de rayon r, quelle est la limite des f_\cdot^{(t)}?

Il faut d'abord regarder qualitativement l'effet de la dynamique: Elle diminue la densité là où le déséquilibre est fort, et l'augmente (relativement) là où il est plus faible.

Il est très facilement possible d'en déduire les points d'équilibre: ils satisfontl'égalité:

f_W^{(\infty)}(x) = { \displaystyle f_W^{(\infty)}(x) \cdot e^{ -\,D^{(\infty)}(x)} \over \displaystyle \int_{u\in \Omega} f_W^{(\infty)}(u) \cdot e^{ -\,D^{(\infty)}(u)} \,du}

ce qui implique que là où f_W^{(\infty)}(x) n'est pas nulle, D^{(\infty)}(x) l'est. Ceci se traduit par le fait qu'il n'y a pas d'individus différents dans le Kr-voisinage de chaque point.

Etudions maintenant la dynamique des densités.

[modifier] Dynamique continue

Le point le plus intéressant est de passer en continu sur l'axe du temps; la dynamique temporelle des densités devient:

\dot f_W(x)={d f_W(x)\over dt} = \left( { \displaystyle e^{ -\,D(x)} \over \displaystyle \int_{u\in \Omega} f_W(u) \cdot e^{ -\,D(u)} \,du} \, - 1 \right) \, \cdot f_W(x)

Le point le plus important va être de noter les propriétés de continuité de tout ces objets:

  • la distance Kr est continue par construction;
  • la dynamique des densités l'est donc aussi.

Cela implique que les trajectoires de la dynamique ne peut pas "faire de sauts" en terme de valeur de du Kr-déséquilibre: on ne peut pas passer d'un Kr-déséquilibre de 4/5 à un Kr-déséquilibre de 3/5 sans passer continuement par tous les points intermédiaires.

Nous devons nous intéresser à la dynamique de DW, donc regarder:

{d\, D_W\over dt}= {\displaystyle \int_{y\in \Omega} \dot f_B(y) K_r(x,y)\, dy \cdot \int_{y\in \Omega} f_W(y) K_r(x,y)\, dy - \int_{y\in \Omega} f_B(y) K_r(x,y)\, dy \cdot \int_{y\in \Omega} \dot f_W(y) K_r(x,y)\, dy \over \displaystyle \left( \int_{y\in \Omega} \left(f_B(y)+f_W(y)\right) K_r(x,y)\, dy\right)^2}

[modifier] Proportions sur petits échantillons

Un petit moment de détente en homage à George Box et à son article What Can You Find Out From 12 Experimental Runs?.

[modifier] Enoncé du problème

J'observe une proportion de 100% individus de classe A sur un petit échantillon (de N points), cela ne veut pas nécesairement dire que la probabilité sous jacente d'appartenir à A est de 100%.

[modifier] Raisonnement

Ce dont je suis sûr, c'est qu'avec une probabilité de 95% (notons le qα, histoire d'être générique), ma proportion observée \hat p, vérifie (passons habilement sous silence que ceci est un résultat asymptotique, alors pour N petit...) :

P\left(\hat p \in \left[ p-\alpha \sqrt{p(1-p)\over N}, p+\alpha \sqrt{p(1-p)\over N}\right]\right)=q_\alpha

au pire, on a donc avec une proba de qα:

\hat p = p+\alpha \sqrt{p(1-p)\over N}
variation de la probabilité en fonction de la taille de l'échantillon
variation de la probabilité en fonction de la taille de l'échantillon

dans notre cas, \hat p=1, d'où:

p = {\alpha^2 N\over 1+\alpha^2 N}

pour qα = .95, α = 1.96 et donc, pour un échantillon de 4 individus:

p^* = {\alpha^2 N\over 1+\alpha^2 N}\simeq 0.9389 < 1

ce qui n'est pas 1...

[modifier] Processus ponctuels et Mesure de Palm

Un processus de sauts ponctuels N est défini par les réalisations d'une variable aléatoire T (à valeur dans un borélien \mathcal{B}) de distribution F:

N(B) = \sum_{k=1}^{\infty}\; \mathbb{I}(T_k \in B),\; B\in\mathcal{B}

qualitativement la mesure de Palm est associée à la probabilité conditionnelle suivante (i.e. la distribution de proba conditionnée par le fait qu'un événement ponctuel ait lieu en t):

\mathbf{P}_{N,t}(X_t \,|\, \delta N(t)=1)

pour X un processus stochastique bien défini et δN tel que:

\mathbf{E}(X_t \,|\, \delta N(t)=1) = \lim_{\tau\rightarrow 0} {\mathbf{E}(X_t \and \delta N([t,t+\tau])=1) \over \mathbf{E}( N([t,t+\tau])=1)}

[modifier] Définitions

Soit (\Omega, \mathcal{A},\mathbf{P}) un espace probabilisé et t) un flot sur cet espace tel que la distribution de probabilité \mathbf{P} soit stationnaire pour θ:

\mathbf{P}\circ \theta_t^{-1} = \mathbf{P}

Soit N un processus ponctuel (issu de réalisation d'une variable aléatoire T) stationnaire pour θ (il est nécessaire de munir \mathbb{R} de ses boréliens \mathcal{B}):

N(\theta_t \circ \omega, I_B) = N(\omega, I_{B+t}),\; B\in \mathcal{B}

Définissons aussi l'intensité de n par:

\lambda_N:=\mathbf{E}(N(]0,1])


La mesure de Palm associée au couple (\mathbf{P},N) est (\ell(B) est la mesure de Lebesgue de B\in\mathcal{B}):

P_N^0(A) = {1\over \lambda_N\, \ell(B)}\; \mathbf{E}\left[\int_B \mathbb{I}_A(\theta_s)\, dN(s)\right]

[modifier] Références

[modifier] Ratio de variance

Soit \displaystyle R(V_1,V_2;w_1,w_2) le ratio:

 R(V_1,V_2;w_1,w_2) = \frac{ w_1' \frac{ V_1}{ {\rm tr}(V_1)} w_1 - w_2' \frac{ V_2}{ {\rm tr}(V_2)} w_2}{w_1' \frac{ V_1}{ {\rm tr}(V_1)} w_1}

\displaystyle V_1, V_2 sont des matrices de variance / covariance, \displaystyle w_1,w_2 des vecteurs tels que w_i' \cdot {1\!\!1}=1

Etudions son comportement dans des cas simples.

[modifier] Augmentation proportionnelle

Si \displaystyle V_2 = \alpha\cdot V, alors \frac{ V_2}{ {\rm tr}(V_2)} = \frac{ V}{ {\rm tr}(V)}. ce qui implique que:

\displaystyle R(\alpha_1\cdot V_1,\alpha_2\cdot V_2; w_1,w_2) = R(V_1,V_2;w_1,w_2)

ou encore

\displaystyle R(V_1,\alpha\cdot V_1;w,w) = 0

[modifier] Dimension 2

Premières simplifications destinées à mieux comprendre le comportement de \displaystyle R(V_1,V_2;w_1,w_2):

\displaystyle V_i\in\mathcal{M}_2(I\!\!R),\; i=1,2 \; ;\; w_1 = w_2

on écrit alors:

V(\sigma_a,\sigma_b,c) = \begin{bmatrix} \sigma_a^2 & \sigma_a \sigma_b\, c \\ \sigma_a \sigma_b\, c & \sigma_b^2 \end{bmatrix},\; w={q \choose 1-q}

R(V_1,V_2;w) = \frac{ w' \left( \frac{ V_1}{ {\rm tr}(V_1)} - \frac{ V_2}{ {\rm tr}(V_2)}\right) w}{w' \frac{ V_1}{ {\rm tr}(V_1)} w}

On peut alors regarder le comportement de \displaystyle R(V(\sigma_a, \sigma_b, c), V(\sigma_a, \sigma_b, c-\epsilon),w) et \displaystyle R(V(\sigma_a, \sigma_b, c), V(\sigma_a-\epsilon_a, \sigma_b, c),w). On trouvera un résultat du genre:

R(V(\sigma_a, \sigma_b, c), V(\sigma_a, \sigma_b, c-\epsilon),w) = \frac{ q(1-q) \epsilon \sigma_a \sigma_b}{w' V(\sigma_a, \sigma_b, c) w}

et

R(V(\sigma_a, \sigma_b, c), V(\sigma_a-\epsilon_a, \sigma_b, c),w) = \frac{q \epsilon_a (\sigma_a ( c + 2) - (1-q)\epsilon_a)}{\mathcal{D}}

ce qui donne:

\mathbf{E}\left( R(V(\sigma_a, \sigma_b, c), V(\sigma_a, \sigma_b, c-\epsilon),w) | \epsilon\sim \mathcal{N}(0,\sigma)\right) = 0

et

\mathbf{E}\left( R(V(\sigma_a, \sigma_b, c), V(\sigma_a-\epsilon_a, \sigma_b, c),w) | \epsilon_a\sim\mathcal{N}(0,\sigma)\right) = \frac{-q(1-q)\sigma^2}{ \mathcal{D}}

Des resultats basés sur une écriture des matrices de variance / covariances diagonalisées, et en perturbant les angles des vecteurs propres (ou le poids relatif des valeurs propres) entre \displaystyle V_1 et \displaystyle V_2.

[modifier] Files d'attente au resto

il suffit d'être trois:

  1. lorsque quelqu'un arrive sur une porte vide on y attend (on l'appelle le "portier")
  2. dès qu'on est deux à une porte le second va chercher les autres portes (on l'appelle le "messager"), sauf si le portier a déjà rencontré deux fois le même portier (cf 2.c), dans ce cas le portier lui donne l'état des files d'attente et il peut entrer s'assoir
    1. si le messager trouve une porte vide il devient un portier
    2. si le messager trouve un portier qu'il ne connait pas il lui dit qu'il est messager et continue sa recherche
    3. si le messager rencontre un portier qu'il connait, c'est qu'il afait le tour des portes (je fais l'hypothèse qu'un messager est capable de trouver toutes les portes) et lui donne l'état de la file d'attente, si c'est la troisième fois au moins qu'il le voit, le portier dit au message le nombre de personnes qu'il a laissé rentrer, ce qui permet au message d'updater son état des lieux, le messager continue ensuite sa tournée des portiers

il faudrait modéliser l'état de la connaissance de chacun, du genre:

  • H1. les arrivées se font suivant un procssus poissonnien de paramètre lambda (par minute)
  • H2. il y a N invités et M portes
  • H3. la proba d'arrivée à chaque porte est équi répartie
  • H4. le temps de transit entre deux portes est de T minutes
  • Question 1:

Quelle est l'espérance du temps d'arrêt de "chaque porte est occupée par un portier" ?

  • Question 2:

Combien de temps en moyenne met le messager pour avoir rencontré deux fois chaque portier ?

  • Question 3:

Sachant qu'il y a un vrai messager (qui a rencontré au moins deux fois chaque portier), quel est la moyenne de la durée entre les événements "une portier a rencontré le messager" et "un nouvel invité arrive à sa porte"?

[modifier] Jeux de casino

Nous avons un processus stochastique Xt dont les accroissements sont binomiaux:

X_{t+1} =\begin{cases} 2 X_t, & \mbox{avec une probabilite }p \\ X_t/2, & \mbox{avec une probabilite } 1-p\end{cases}

Nous disposons d'une somme S0 dont nous pouvons jouer une fraction q à ce jeu à chaque instant.

Au bout d'une itération du processus, nous avons:

S_{t+1} =\begin{cases} S_t (1+q), & \mbox{avec une probabilite }p \\ S_t (1-q/2), & \mbox{avec une probabilite } 1-p\end{cases}

Et au bout de K itérations, on a:

S_{t+K} = S_t (1+q)^k (1-q/2)^{K-k} C_K^k \mbox{ avec une probabilite } p^k (1-q)^{K-k}

pour chaque k entre 1 et K.

[modifier] Lectures et travaux en cours: ma file d'attente

  • une équation implicite en Recovery Rate:

(CDS x Recovery Rate) \rightarrow Proba(def) \rightarrow (Barrière implicite x Recovery Rate)

  • Relations statistiques entre structure du capital et:
    • caractéristiques de trading
    • Proba de def
  • estimation nonparamétrique du MI instantané
    • manque résultats théoriues ('forme de la frontière)
  • modèle YB
  • Dominance stochastique:
    • Hanoch, G., and H. Levy (1969): The Efficiency Analysis of Choices Involving Risk, Review of Economic Studies 36, 335-346.
    • Application à la comparaison de distribution selon une direction
  • classement de liquidité (ranking et proximité)
  • liquidité instantanée (coût moyen d'un ATP) et dynamique (vitesse de reformation du CO)

[modifier] Nombres

\mathbf{T}(N)=N+(N-1)+(N-2)+\cdots+1=\frac{N(N+1)}{2}

\mathbf{P}(N)=\sum_{n=1}^N \mathbf{T}(n) = \frac{N(N+1)(N+2)}{6}