Discuter:Analyse en composantes principales

Un article de Wikipédia, l'encyclopédie libre.

Sommaire

[modifier] Sur le fond

Attention la quasi-totalité des formules de la page sont fausses (covariances, correlations) car elles n'incluent pas la pondération des individus. En général, les individus sont équiprobables de poids 1/n.

---?


Pour ma part je trouve qu'il faudrait ajouter

l'analyse en composante principale (pca en anglais) est aussi une méthode statistique. Cette méthode essaie de trouver pour un ensembles de points un nouveau système de coordonnées tel qu'on observe si on place les points dans ce nouveau système de coordonnées, la plus grande variance selon le premier axe, la deuxième plus grande variance selon le deuxième axe, ...

Plus précisément,Si l'on considère que l'on est dans un espace à n dimensions, la pca cherche une transformation orthogonale pour projeter les points du système de coordonnées actuel dans le système de coordonnées 'principal', on peut appliquer cette transformation et ensuite ne garder que les m (m<n) dimensions qui 'expliquent' le plus la variabilité des points. On peut utiliser cette méthode pour réduire la dimensionnalité de données tout en essayant de garder un maximum de l'information contenue dans les données.

il faut la distinguer de l'analyse en coordonnées principales qui est plus généralement appelé échantillonnage multidimensionnel ou multidimensionnal scaling (MDS) : pour des points dans un espace à n dimensions pour lesquels nous connaissons la distance ou la similarité entre chaque paire de points. cette méthode donne la position des points dans le système de coordonnées principales (de la pca) telle que les distances entre ces points soient respectées 'pour le mieux'.

Plusieurs notions de distances et de similarités existent, la façon de définir 'pour le mieux' diffère pour les différentes version du MDS.

Néanmoins il faudrait en discuter et je peux dire des bêtises, il est intéressant de consulter wikipédia anglais à propos de la pca et du mds et la conclusion de l'article de gopher(1966) (Some distance properties of latent root and vector methods used in multivariate analysis) pour le lien entre principal components analysis et principal coordinate analysis ) Et de plus cela devrait aussi être décrit de façon plus formelle. Qu'en pensez vous ?

--Dwarfy 22 avril 2007 à 03:30 (CEST)

[modifier] Sur la forme

Les deux axes d'une ACP sur la photo d'une gymnasteune image de plus que je n'utilise pas pour l'instant
Les deux axes d'une ACP sur la photo d'une gymnaste
une image de plus que je n'utilise pas pour l'instant
  • Mettre des illustrations
  • plus d'explications naturelles







.

[modifier] Divers

[modifier] Critère d'inertie

Dans cette section, finir un paragraphe autour de :

En effet, la formule d'un inertie d'un nuage de points X_{.,1},\ldots,X_{.,K} de {I\!\!R}^N autour de l'axe u est bien: ...

Si l'on part de l'analyse du triplet <X,M,D> (M produit scalaire "individu", D produit scalaire "variable"), l'inertie projetée sur un axe Δu de vecteur directeur u est {}^t \! (XMu)D(XMu)={}^t \!u M{}^t \!XDXMu={}^t \! uMVMuV={}^t \! XDX est la matrice de covariance du nuage de points X.

L'ACP usuelle prenant M comme la matrice identité, le résultat final est {}^t \! uVu.

[modifier] Projection

Il y avait ce paragraphe dans la version précédente de l'article, il est peut-être possible de la conserver:

Cette réduction de dimension s'accompagne d'une perte d'information, mais elle est minimisée à l'aide d'un changement de base, de sorte que les axes conservés soient les plus représentatifs possibles.
La notion de représentativité d'un axe est par exemple évaluée à l'aide d'un critère de variance. Plus la variance est grande selon un axe donné, plus celui-ci est "représentatif".

[modifier] Résultats théoriques

à rédiger en grande partie:

  • valeurs propres
    • loi de Wigner (loi du demi cercle)
    • support de la distribution des valeurs propres (sortir du support?)
    • loi de Brady
  • vecteurs propres
  • distribution des composantes (par rapport à une gaussienne)
  • stabilité au cours du temps

[modifier] Otuils pour générer des exemples

[modifier] Intérêt du concept

Si je pense aux articles qui vont pointer sur l'article ACP, il va draguer des lecteurs qui souhaitent comprendre le sujet de manière générale, sans avoir nécessairement la volonté ou la capacité d'entrer directement dans les détails techniques. Il me semble nécessaire d'ajouter une partie, intérêt du concept et l'intro est un peu aride. Soit le lecteur connaît le sujet et il n'en a pas besoin, soit il ne le connaît pas et il va souffrir. Jean-Luc W 12 avril 2006 à 07:34 (CEST)

tout à fait d'accord, je vais aussi mettre des dessins (c'est plus accrocheur et plus parlant), j'espère arriver à un truc assez proche de ton article sur les valeurs propres que je trouve assez exemplaire... Lehalle

Superbe ton intro, clair, parlante, vraiment sympa. Si j'ose une critique, le choix des dessins n'est pas à mon avis, suffisament instructif. Dans la vraie vie, je ne fais pas d'ACP sur une photo, ma dernière est sur la corrélation entre des primes et des résultats commerciaux. Une centaine de points dans un espace de dimension 16, pour moi c'est plus parlant. Pour établir un pont entre ton travail et les maths. Je te propose un résumé de l'état de l'art un peu éparpillé partout. Valeur propre est clairement un point d'ancrage, mais c'est un point d'ancrage à cause de réduction d'endomorphisme. Il faut donc refondre et étoffer l'article sur la réduction, car fondamentalement c'est ce que tu fais dans ton ACP, tu réduis un endomorphisme. Cette article doit donc devenir pivot. Mais comment réduis tu ton endomorphisme? avec des techniques d'algèbre bilinéaire c'est en fait un endomorphisme autoadjoint. Il faut donc restructurer la réduction pour inclure le cas bilinéaire. Mais cette approche ne fournit que la théorie, or si la théorie doit être présente dans WP, nous ne pouvons nous arréter là, il faut aussi inclure l'aspect appliqué. D'ou la nécessité d'un pendant appliqué. Le modèle commence à s'implémenter dans le cas nilpotent. Si tu as une seconde, regardes matrice nilpotente et endomorphisme nilpotent, c'est la première instance pour utiliser une structure qui répondra à ton besoin. Si elle te plait, dans une quinzaine de jours, tu auras ton bonheur, à la fois en terme théorique et appliqué pour l'ACP. D'autres matheux, travaillent dans la même direction et l'article Déterminant est maintenant surement le plus achevé, qu'en penses tu? Jean-Luc W 16 avril 2006 à 02:04 (CEST)

Ici aussi tu as raison, je vais regarder les articles que tu pointe puis aller vers des exemples plus appliqués. Mon caractère me pousse d'abord à construire une structure à peu près cohérente du point de vue théorique, j'y attacherai ensuite les exemples. Lehalle

[modifier] Sujets connexes

  • AFC: Analyse Factorielle des Correspondances, pour les tableaux de contingence (2 variables qualitatives).
  • ACM: Analyse des Correspondances Multiples, pour les tableaux de n variables qualitatives.
  • AFD: Analyse Factorielle Discriminante.

[modifier] Références externes

Pour s'en inspirer

[modifier] Sylvester et ACP

Avec ta rédaction, et les progrès dans la formalisation en maths, la connexion des stat des maths pure et des maths app, devient infiniment plus clair. Pour les maths pures, l'article entre dans les conséquences du théorème spectral en algèbre bilinéaire, en conséquence des travaux de Sylvester sur le principe de l'inertie. Le cas est aussi traité en algèbre linéaire, théoriquement dans l'article sur la diagonalisation et par les applications dans le cas des valeur propre. Pour l'aspect théorique, l'algèbre linéaire, commence à être nettoyé mais il reste du boulot en bilinéaire (ou il n'y a pas grand chose).

Pour les maths app, à mon avis, il faut une connexion avec matrice diagonalisable et un autre dans le cas de l'algorithmique dans le genre des facteur invariant mais dans le cas symétrique. Je ne sais pas si Factorisation de Cholesky est la plus utilisée dans ton cas Salle pourra nous renseigner.

Un détail, au sens de Sylvester tu minimises le moment d'inertie et tu ne le maximise pas, pense à l'exemple du balais dans valeur propre ton premier axe d'ACP est l'axe 1 qui possède la plus petite inertie (c'est là ou il est le plus facile de le faire tourner). Jean-Luc W 23 avril 2006 à 13:14 (CEST)