Discussion Portail:Probabilités et Statistiques

Un article de Wikipédia, l'encyclopédie libre.

Sommaire

[modifier] Catégories de statistiques et de probabilités

Ce portail s'intitule "Portail:Probabilités et Statistiques", il faut donc y inclure:

  • les portails probabilistes
  • les portails statistiques

[modifier] Statistiques

En ce qui concerne les statistiques, il semble que seul le portail "Portail:Statistique descriptive" existe, il faudrait donc créer d'autres portails sous-thématiques, je propose:

  • Statistique descriptive
  • Analyse des données
  • Analyse de la variance
  • Estimateurs statistiques (les regressions, les classifieurs et d'autres)

dans ce cas il faudrait passer l'Analyse en composantes principales dans "analyse des données" (et pas dans stat descriptives).

Il faudrait aussi s'arranger pour que tous les éléments de la Catégorie:Statistiques aient leur place.

[modifier] Probabilités

De même, il fadrait que la plupart des thèmes présents dans /Catégorie:Probabilités aient leur place sur ce portail.

Lehalle(discussion)

[modifier] Choses à faires

c'est fait:

modifier Articles de mathématiques en rapport avec les probabilités ou les statistiques
Statistiques descriptivesAnalyse des donnéesVisualisation des donnéesEstimateursTests statistiquesSéries temporelles et économétrieStatistique MathématiqueThéorie des probabilitésVariables aléatoiresInégalitésThéorèmes limitesProcessus stochastiquesLa mécanique statistiqueLes statistiques et l'économieLes statistiques et la sociologieLes statistiques et les sciencesLes probabilités et les jeux • Les équations aux dérivées partielles et les probabilités

Lehalle(discussion) 5 novembre 2006 à 14:30 (CET)

[modifier] Mise en forme

Je me suis permis d'aligner la présentation de ce portail sur le modèle standar (cf Aide:Créer un portail, j'ai tenté de conserver les couleurs originales).

Reste à discuter de sa réalisation sous forme de sur-portail, et donc de la création des portails:

  • Portail :Lois générales de probabilités
  • Portail:Variables discrètes
  • Portail:Variables continues
  • Portail:Induction statistique
  • Portail:Théorie des tests
  • Portail:Ajustement linéaire

ce qui me paraît bien compliqué, peut-être pouvons-nous dans un premier temps nous focaliser sur ce portail directement? Lehalle(discussion)

[modifier] Encouragement et suggestions

Bonjour, et bon courage. Je te signale que mes contributions en stat et proba touchent principalement les mathématiques élémentaires et une tentative désespérée pour sauver l'article d'entrée sur les statistiques. Pour l'instant, il me semble qu'il serait sage de ne pas penser aux sous-portails , que l'on pourra toujours créer en cas de surpeuplement. Je ne veux pas décourager Stendhalconques mais son portail sur la géométrie descriptive n'apporte pas beaucoup de plus qu'une catégorie. Il me semble qu'une présentation en tableau comme dans le portail:géométrie avec deux grandes rubriques

  1. Statistiques
    1. Statistique descriptive
    2. Statistique mathématique ou inférence statistique (je n'arrive pas bien à distinguer les deux notions
    3. Théorie des tests
  2. Probabilité
    1. Variables discrètes
    2. Variables continues
    3. Définitions de probabilités

Normalement, avec ces 6 cases, on devrait pouvoir ranger une grande partie des articles. Il faudrait aussi un mot du président expliquant ce double portail par l'imbrication permanente des probabilités et des statistiques. Enfin, pour défendre mes petits, j'aimmerais bien un petit lien vers probabilité (mathématiques élémentaires) et statistique (mathématiques élémentaires). Les ajustement, les estimateur, les analyses devraient se ranger dans inférence statistique. A moins que tu n'aies une idée plus précise que moi de la notion d'analyse des données. HB 21 août 2006 à 22:25 (CEST)

[modifier] Statistique mathématique

De mon point de vue les "stat math" sont juste une partie de la théorie des proba qui étudient les propriétés des statistiques (par exemple leur limites asymptotiques, etc). Elles nourissent donc l'ensemble des stats en résultats (dont les tests et les "stats des[criptives]"). A mon sens le meilleur bouquin sur le sujet est "statistiques mathématiques" de Borovkov (il existe une version en français au éditions MIR -que je cherche désespérement- ainsi qu'une version anglaise chez GIB (ISBN 9056990187)). Lehalle(discussion)

[modifier] Inférence statistique

L'inférence statistique est très générale. Par exemple, d'un certain point de vue on peut dire que les "stats des" y puisent pas mal, puisque dès qu'on estime une moyenne ou une variance, il s'agit d'inférence statistique.

Ton objectif était de rassembler les trois catégories:

  • Analyse des données
  • Analyse de la variance
  • Estimateurs statistiques (les regressions, les classifieurs et d'autres)

en une seule. Cela me paraît délicat, car:

  • conserver l'analyse des données permet d'aller vers les applications du type "data mining" qui sont beaucoup utilisées
  • les estimateurs statistiques sont aussi importants en tant que tels

en ce qui concerne l'analyse de la variance, c'est plus discutable, mais j'ai une tendresse particulière pour ce domaine, qui (à vérifier) fait pour moi le lien avec d'anciennes méthodologies statistiques (il y a une 100aine d'années) et permettrait de faire des remarques du genre "on n'a pas inventé grand chose d'autre que des gammes de modèles"...

ton ajout "tests d'hypothèses" est très positif, car il s'agit bien d'un champ utilisé à part (qui peut pointer par exemple sur les applications médicales). Lehalle(discussion)

[modifier] Présentation du portail

je trouve aussi l'idée d'un "grand tableau" (comme celui de géométrie) pas mal du tout, mais je n'ai pas eu le courage de le faire. Lehalle(discussion)

Eh bien, allons-y ! Quels sont les grands domaines des probabilites et statistiques ? Ektoplastor, le 25 octobre 2006, 02:48 CEST.

[modifier] Proba et stats

tout à fait d'accord pour faire la différence entre proba et stats, sachant que si on fait un portail pour les deux (ce que je trouve être une très bonne idée de Utilisateur:Stendhalconques), une valeur ajoutée est de faire le pont entre les deux champs. L'article statistique mathématique peut être utilisé pour mettre en avant de façon formelle et générique les liens, mais le vrai plus serait de mettre en place des correspondances (accessibles par ce portail). Lehalle(discussion)

[modifier] Elementaires, mon cher Watson

Avoir une partie "éducation" dans le portail est une idée tellement élémentaire (sans jouer sur les mots) que je m'en veut de ne pas l'avoir eue immédiatement. voila qui est fait.

Lehalle(discussion)

[modifier] Les classement stats/proba/applications

J'ai opté pour cette catégorisation, discutons-en ici... Lehalle(discussion) 23 août 2006 à 20:14 (CEST) Mes connaissances en proba/stats sont limitees. Mais cette categorisation ne me semble pas problematique, seulement pas assez detaillee. J'aurais opte pour trois fenetres distinctes, probabilites, statistiques et applications. Dans probabilites, on peut separer les probas discretes, les processus, ... Ektoplastor, le 25 octobre 2006, 2:42 CEST.

[modifier] Liens externes

[modifier] Francis Galton

Je viens de prendre connaissance de ce projet. Bravo pour l'initiative. Par contre, je tombe sur la photo de Francis Galton, qui est reconnu comme étant le père de l'eugénisme, je trouve ça un peu limite... recyclage 23 septembre 2006 à 15:36 (CEST) J'ai remplacé par Pascal, plus neutre. recyclage 23 septembre 2006 à 15:42 (CEST)

Au lieu de faire une image du mois, il est possible de creer une selection (pseudo?)aleatoire des photographies de probabilites et/ou statisticiens. C'est plus agreable : a chaque ouverture du portail, la photographie change, ce qui rend le portail interactif. C'est ce qui est fait habituellement pour Lumiere sur ... S'inspirer des autres portails. Ektoplastor, le 25 octobre 2006, 02:46 CEST.

[modifier] Critiques generales

  • Les couleurs : le rouge vif fait mal aux yeux, trop de contraste. Si on decide de palir le rouge, il risque de ne pas trancher avec les couleurs du portail geometrie. Il est difficile de choisir une couleur, mais il ne faut pas utiliser les couleurs vives.
  • Le titre : Il faudrait creer un bandeau. Mais peut-etre pas dans l'immediat. Ameliorons le portail.
  • La fenetre Categories : pauvre en information, et a mon avis peu pertinente.
  • La fenetre Le saviez-vous : Encore une fois, il faut preferer une selection aleatoire et eviter les sujets d'actualites. A la limite, creons une fenetre actualite scientifique a mettre a jour a la main (mais je ne me sens pas courage de le faire).
  • Penser a creer une chronologie des statistiques et probabilites. Ne pas suivre l'exemple du portail geometrie (a mon grand regret).

Ce ne sont que des suggestions d'amelioration sur lesquels j'attends des reactions avant d'entreprendre des modifs. Ektoplastor, le 25 octobre 2006, 02:55 CEST,

Je répond à toutes tes remarques (celle-ci et les deux autres) ici:

les catégories:

  • Stat
    • Statistiques descriptives
    • Analyse des données (statistiques multivariées)
    • Visualisation des données
    • Estimateurs
    • Tests statistiques
    • Séries temporelles et économétrie
    • Statistique Mathématique
  • Proba
    • Théorie des probabilités
    • Variables aléatoires
    • -Inégalités
    • -Théorèmes limites
    • Processus stochastiques
  • Applications
    • la mécanique statistique
    • -Les statistiques et l'économie
    • -Les statistiques et les sciences
    • -Les probabilités et les jeux
    • -Les équations aux dérivées partielles et les probabilités

modifions cette liste et faisons un bilan sur ce qu'il manque (j'ai mis une icone - sur les articles manquants)...

la sélection aléatoire: C'est une bonne idée, mais pour cela il faudrait sans doute avoir plus d'articles... pour l'instant je n'ai pas le courage de le faire.

les remarques générales:

  • Pour la couleur: je suis totalement d'accord, change la couleur si tu as une idée...
  • Pour le bandeau: pareil, je n'ai aucune préférence, juste pas le temps ni le courage d'en faire un à ce stade du portail...
  • Les catégories: c'est juste parce que je trouve le portail pas encore mûr, alors les catégories sont des moyens sûrs d'atteindre tous les articles. Il faudrait peut être mieux les mettre en dehors d'un encadré... voila qui est fait.
  • pour la chronologie, c'est bien entendu une bonne idée, mais il y a du travail...

en tout cas merci pour ta relecture - Lehalle(discussion) 5 novembre 2006 à 13:43 (CET)

A l'origine de l'article (simpliste) Statistique mathématique j'avais introduit les quatre catégories qu me paraissaient classiques en la matière :
  • Echantillonnage.
  • Estimation.
  • Intervalles de confiance.
  • Tests d'hypothèse.
Dans le plan prévu, Echantillonnage et Intervalles de confiance ont disparu. Sont-ils inclus dans Estimation ? Que reste-t-il pour l'article Statistique mathématique ? Jct 12 novembre 2006 à 17:31 (CET)
Peux-tu être plus précis ? De quelles catégories parles-tu ? parles-tu des différents paragraphes de l'article Statistique mathématique ? Si oui, l'article n'a pas changé, il sert à introduire les notions développées dans des articles qui seront amenés à se développer. Parles-tu du portail ? Si oui, estimation (homonymie) a été remplacé par estimateurs et test d'hypothèse s'intitule dans le portail tests statistiques mais revoie sur test d'hypothèse. Ai-je répondu à ta question?

HB 12 novembre 2006 à 18:45 (CET)

Je ne mettais pas en cause la terminologie de deux rubriques du portail (en fait du texte situé ci-dessus dans les catégories), je demandais simplement où se situent les deux autres dont le nom ne me semble pas apparaître. En fait, c'était aussi un commentaire indirect sur la rubrique 4.1 Statistique mathématique « De mon point de vue les "stat math" sont juste une partie de la théorie des proba qui étudient les propriétés des statistiques (par exemple leur limites asymptotiques, etc.) » qui semble vouer à la destruction l'article existant. Plus généralement il me semble intéressant, indépendamment du jargon, de maintenir l'opposition que je note statistique descriptive/statistique mathématique. La première réduit une population selon des méthodes algébriques parfaitement arbitraires (exemple le plus simple, le choix entre moyenne et médiane n'est basé sur aucun critère objectif). La seconde qui concerne les « conclusions concernant les lois de probabilité des phénomènes », permet d'associer une loi de probabilité à la population, la validité de cette association étant caractérisée par des intervalles de confiance.
Dans l'Encyclopaedia Universalis (édition 1985 mais je ne pense pas que les notions aient fondamentalement évolué depuis), on trouve un point de vue qui me paraît proche de celui que j'ai esquissé. Outre la production de statistiques, l'article distingue l'analyse des données et l'inférence statistique classique (appelée statistique mathématique dans l'introduction).
  • Analyse des données
    • Statistique descriptive
    • Analyse en composantes principales
    • Régression linéaire
    • Analyse factorielle discriminante
    • Analyse factorielle des correspondances
    • Méthodes de classification
  • Inférence statistique classique
    • Théorie de l'échantillonnage
    • Théorie de l'estimation (inclut la notion d'intervalles de confiance)
    • Test du X2
    • Théorie générale des tests
    • Théorie des décisions statistiques Jct 14 novembre 2006 à 10:53 (CET)
La page Statistique descriptive (en cours de réaménagement) définit la variance empirique corrigée puis ajoute un commentaire pour dire que c'est une notion de statistique mathématique, la variance de la statistique descriptive étant un peu plus petite ! Même remarque pour les intervalles de confiance, notion de statistique mathématique par excellence, dont il est question à trois reprises. Le paragraphe qui tente de définir clairement cette notion se réfère à la loi des grands nombres, notion de probabilité, mais un sommet est atteint en remettant le couvert Quand l'ensemble de n point ne constitue pas un échantillon de la population, mais la population totale, la variance sans biais n'a pas à être utilisée, puisque l'on n'est plus dans un contexte d'estimation mais de mesure ! La distinction dans le portail entre Statistique descriptive et Statistique mathématique (avec éventuellement une terminologie différente bien que celle-ci ait l'avantage de faire apparaître clairement l'opposition des méthodes) et l'introduction de rubriques Echantillonnage et Intervalles de confiance pourrait freiner ce genre de confusion qui laisse perplexe le lecteur cherchant des informations sérieuses dans wikipedia.Jct 15 novembre 2006 à 11:06 (CET)
Ca n'est pas très gentil de sousentendre que les informations que l'on apporte ne sont pas sérieuses :- (. Même si je n'avais pas lu avec suffisamment de sérieux tes commentaires :-) Oui, bien sur qu'il faudrait un article de niveau universitaire sur la notion d'intervalles de confiance et plusieurs articles sur les tests d'hypothèses. Oui, bien sur que les articles de statistiques partent dans toutes les directions et méritent une harmonisation. Pour l'instant, nous ne sommes que de très rares intervenants sur cette partie de Wikipédia : Lehalle, une IP (voir régression linéaire multiple par ex) , moi (qui suis de formation probabiliste et qui n'enseigne qu'en lycée) et toi, ce qui est très pauvre. Donc n'hésite pas à enrichir, je pense que les articles trouveront leur articulation quand cette partie de l'encyclopédie sera plus riche. Oui, bien sur, il faut une distinction entre statistique descriptive et statistique mathématique (inférentielle ?) Tu sembles reposer le problème de terminologie statistique mathématique/statistique inférentielle puisque tu emploies tantôt l'un et tantôt l'autre. Quelles nuances, quel classement ? Tu critiques par exemple le contenu de statistique descriptive. Pourquoi ne pas le modifier ou évoquer dans la page de discussion de l'article tes réticences que la néophyte que je suis partage un peu : pourquoi une variance estimée dans la statistique descriptive ? si oui, comment l'introduire ? Tu remarques que les intervalles de confiances sont évoqués dans la statistique descriptive, c'est un fait qu'ils y sont employés. Il est donc nécessaire de renvoyer sur un article sérieux exposant leur fondement mathématique et probabiliste et expliquant pourquoi ils sont devenus un outil simple de description en statistique descriptive. . Quant à la terminologie différente, il me semble que ce n'est pas à nous de révolutionner la terminologie usuelle mais ce que j'en dis ... Enfin bon courage car le travail ne manque pas. HB 15 novembre 2006 à 22:19 (CET)
  • Quand je parle d'informations sérieuses, je me réfère uniquement à la confusion qui – selon moi – règne dans Statistique descriptive (et ailleurs). Cette confusion provient pour une large part de la méthode wikipedia selon laquelle n'importe qui peut ajouter une remarque sans s'interroger sur sa cohérence avec ce qui précède. Ce n'était pas une attaque envers qui que ce soit, en tout cas pas envers toi dont je n'ai pas analysé les contributions.
  • C'est visiblement moi qui me suis fait mal comprendre dans mes messages successifs. Ils concernaient essentiellement l'organisation du portail qu'un message de Lehalle m'avait invité à commenter et/ou modifier. J'ai choisi le commentaire, espérant obtenir approbations ou, plus vraisemblablement, critiques et améliorations. Il me reste en effet en mémoire l'expérience de Variable aléatoire que j'avais pas mal fait grossir (d'abord en tant qu'IP) et les commentaires désagréables, sans aucune idée positive, d'un certain Exol (voir Discussion Utilisateur:Jct). J'essaie donc de reposer les questions qui me paraissent importantes avant de me lancer dans ce que je jugerais être raisonnable et me faire descendre en flammes par des spécialistes réels ou auto proclamés.
    • Faut-il ou non introduire des rubriques Echantillonnage et Intervalles de confiance au même niveau qu'Estimateurs et Tests statistiques ?
    • Ai-je bien interprété le paragraphe 4.1 de cette Discussion selon lequel les descriptions sommaires de ces quatre notions n'auraient rien à faire dans l'article Statistique mathématique ?
    • De manière plus fondamentale, faut-il ou non distinguer ce qui relève de l'algèbre pure et ce qui relève de la théorie des probabilités quelle que soit la terminologie (statistique mathématique ou statistique inférentielle ou..., statistique descriptive ou analyse des données ou...). J'ai une préférence mais ce n'est pas le problème.
  • Quitte à aggraver mon cas, je ne suis pas d'accord sur un point. Donc n'hésite pas à enrichir, je pense que les articles trouveront leur articulation quand cette partie de l'encyclopédie sera plus riche. Comment obtient-on un logiciel à peu près correct, en ajoutant des verrues à des verrues ou, autant que faire se peut, en le structurant au départ ? Même si, je le sais, je ne suis pas spécialement diplomate, ne prends pas mes commentaires pour des agressions mais pour des idées à discuter pour tenter d'aboutir à un résultat aussi cohérent que possible. Jct 16 novembre 2006 à 11:47 (CET)

[modifier] Utilisation de maths "générales" en statistiques

je rebondi sur ta remarque:

"De manière plus fondamentale, faut-il ou non distinguer ce qui relève de l'algèbre pure et ce qui relève de la théorie des probabilités quelle que soit la terminologie (statistique mathématique ou statistique inférentielle ou..., statistique descriptive ou analyse des données ou...). J'ai une préférence mais ce n'est pas le problème."

faut'il reformuler la diagonalisation pour bien exposer l'ACP? la théorie de l'information pour l'ACI? il me semble clair qu'il faut mettre des liens, et pour ceux qui en ont le courage, la reformulation est souvent plus claire. Lehalle(discussion) 5 février 2007 à 22:09 (CET)

Décidément, j'ai le plus grand mal à me faire comprendre et, en ce qui concerne ce problème particulier, à comprendre la réponse à un seule question choisie parmi trois. Je crois comprendre (?) que cette réponse porte sur le degré d'abstraction mathématique, ce qui ne correspond absolument pas à mon point de vue puisque je mets dans le même sac (algébrique) l'ACP et le calcul d'une simple moyenne.
J'ai tenté d'exposer dans Statistiques#Statistique descriptive et statistique mathématique ce point de vue qui encore une fois, au delà du jargon, est assez classique. Si je ne me fais toujours pas comprendre, je n'ai plus qu à parler d'autre chose. Jct 6 février 2007 à 10:28 (CET)

[modifier] Réogranisation en cours

Je pars de l'article Statistique descriptive pour essayer de structurer tout ce qui devrait être en dessous; pour l'instant j'en ai fait une liste dans la section voir aussi. C'est l'hallu totale: des artciles redondants, pas du tout homogènes (en volume comme en qualité)... bref, il y a du travail... Lehalle(discussion) 5 novembre 2006 à 15:02 (CET)

[modifier] Nicole El Karoui

Bonjour! Je ne suis pas mathématicienne, ça me gêne, ça me gêne, mais quelle est la probabilité pour que Nicole El Karoui ait un article sur wikipédia? Est-ce qu'elle n'a pas la notoriété et l'autorité scientifique suffisante ? J'ai lu plusieurs articles dans la presse (Le Monde) et je regardais donc ce qu'il y avait ici, mais rien que des liens rouges. Du coup je me demandais si c'était uniquement une personnalité médiatique et si elle était contestée par ses pairs? --Anne 17 novembre 2006 à 05:38 (CET)

Il est clair que Nicole El Karoui est bien une mathématicienne, et pas un phénomène médiatique. Beaucoup de mathématiciens vivants n'ont pas de page sur wikipedia, ce n'est pas un signe de non reconnaissance. Lehalle(discussion) 4 décembre 2006 à 17:20 (CET)
Non, mais dans la mesure où on constate que les filles sont parfois intimidées par les mathématiques, c'est bien de dédramatiser en leur montrant que non, c'est possible. Bon, c'est peut-être un point de vue militant. --Anne 4 décembre 2006 à 18:42 (CET)

Elle a en fait une page, et en ce qui concerne le militantisme:

Il ne faut pas être intimidé par les mathématiques... - Lehalle(discussion)

maintenant je vais être intimidée par l'orthographe ...... Sourire Merci --Anne 5 décembre 2006 à 09:01 (CET)

[modifier] Je reviens après une absence

Je n'ai pas eu le temps de beaucoup intervenir dans le portail. Que ceux qui critiquent n'oublient pas que Wikipédia est une oeuvre collective et je ne vois pas ce que le féminisme militant vient faire là dedans. Personne n'a interdit à une femme d'écrire dans wikipédia : le délire gauchiste n'a pas de place dans le rationnel mathématique. Si vous avez des idées corrspondant au sujet exposez les. S' il y a des liens rouges et bien complétez les.

Stendhalconques 3 janvier 2007 à 09:43 (CET)

[modifier] création d'une ébauche de mot du président

conformément à une remarque de HB, j'ai ajouté dans l'introduction un embryon d'explication de la raison d'être du portail. Il faut maintenant rédiger la page qui explique en détail le lien entre proba et stat:Interconnections entre la théorie des probabilités et les statistiques. (le titre est un peu long, mais je ne vois pas comment faire plus court sans perdre en clarté). --Bzhboy 13 février 2007 à 20:39 (CET)

Il y a une faute d'orthographe dans le titre de l'article : en français, connexion s'écrit avec un X, et non pas avec CT. L'article a été renommé en Interconnexions entre la théorie des probabilités et les statistiques. Knightelf 9 septembre 2007 à 23:56 (CEST)

[modifier] Liste de suivi commune du Portail/Projet

Afin de favoriser le travail communautaire, pensez à exploiter au maximum toutes les possibilités du logiciel MediaWiki. Il est ainsi possible de bénéficier d'une liste de suivi commune dont la mise en place est très facile.


Exemple avec le Portail:Stargate :

A partir de la liste Modèle:Portail Stargate/Suivi (qui est parfois nommé Index sur d'autres portails), il suffit de se rendre sur Special:Recentchangeslinked/Modèle:Portail_Stargate/Suivi pour visualiser facilement toutes les modifications sur les articles en rapport avec le portail ci-dessus.


Cette méthode est facilement généralisable et peut vous aider à vous tenir au courant et suivre le travail des autres membres du Portail/Projet.

Pour plus d'informations, n'hésitez pas à me contacter ou à déposer une requête aux bots pour être aidé lors de la création de la liste.

Chico (blabla) 12 mai 2007 à 13:38 (CEST)

[modifier] bandeau portail

Hello. Il existe un bandeau magnifique qui relie à ce portail : Modèle:Portail probabilités et statistiques.
Il n'est utilisé au moment où je parle que par une dizaine d'articles. Il faudrait l'insérer sur tous les articles concernés. Est-ce que ce bandeau est provisoire et c'est la raison pour laquelle il n'est pas utilsé ? Dans le cas contraire... action !! Cela attirera plein de lecteurs ici. MaCRoÉ©o bla bla 16 juin 2007 à 23:12 (CEST)