Discuter:Statistiques

Un article de Wikipédia, l'encyclopédie libre.

Pour les statistiques de Wikipédia, voir Wikipédia:Statistiques. 


Sommaire

[modifier] Refonte de l'article

cela vaudrait sans doute le coup, qu'en pensez-vous? Lehalle(discussion) 24 juin 2006 à 17:33 (CEST)

Bon c'est moi, qui ai invité Lehalle au grand nettoyage. En effet, je trouve que cet article part dans tous les sens.
  • Il me semble qu'il faudrait une intro style en:Statistics
  • Il faudrait un éclairage historique
  • Il faudrait savoir ce que chacun met derrière les mots : statistique mathématique, statistique descriptive, statistique inférentielle,
  • Il me semble que le développement des statistiques descriptives n'a rien à faire ici. Seul un résumé pour en indiquer l'esprit et un renvoi sur la page adhoc (complétée par le contenu de cet article) me semble convenir.
  • Le paragraphe sur le metier de statisticien me semble à sa place
  • Celui sur régression linéaire doit être déplacé dans l'article régression linéaire

...

Je propose que chacunes des 18 sections soient étudiées dans 18 sections de la page de discussions ou moins s'il y a concensus de nettoyage. HB 24 juin 2006 à 17:58 (CEST)

oui ! c'est le bazar !! Tes propositions me conviennent. Je rajoute qu'il y a souvent confusion entre les techniques de stats elles mêmes et leurs applications... Sylenius 24 juin 2006 à 22:20 (CEST)

[modifier] Propositions

Bon, j'ai mis en ligne un proposition d'introduction et un article historique, je pense développer un chapitre sur les champs d'application.

C'est sur la partie théorique que la réorganisation s'impose je verrai bien un grand chapitre

  • démarche statistique
    • recueil des données
    • analyse des données (résumé renvoyant sur statistique descriptive)
    • interprétation des données (résumé renvoyant sur ???? parlant d'estimateur, de test d'hypothèse et d'étude de corrélation

Mais c'est encre bien vague...HB 25 juin 2006 à 13:15 (CEST)

[modifier] Refonte effectuée

Bon, j'ai essayé de répartir les considérations sur les statistique descriptive dans l'article adhoc, de déplacer et d'incorporer dans l'article corrélation (mathématiques) toutes les considérations (en doublon) figurant dans l'ancien article., de regrouper les autres informations dans 4 branches recueil des données, traitement des données, statistique inférentielle, statistique mathématique.

Je crains cependant qu'il soit difficile de faire une répartition claire entre ce qui concerne les statistique inférentielles et et les statistiques mathématiques.

Il me semble nécessaire de créer un article sur estimateur (statistique) Dans la refonte, je n'ai pas su où mettre les informations suivantes, déposées de manière provisoire ici

  • Statistiques sur plusieurs variables

Lorsque l'on collecte des mesures de deux grandeurs X et Y, on obtient une série de couples de valeurs (xi,yi). Le modèle mathématique correspondant est celui de deux grandeurs X et Y. Dans cas, les valeurs xi sont des réalisations de la grandeur X, et les valeurs yi des réalisations de Y. On dit que X et Y sont dépendantes s'il existe un lien entre les valeurs prises par X et par Y (et on peut alors espérer, connaissant la valeur de X, prédire la valeur de Y). Concrètement, cela peut vouloir dire que l'une des deux grandeurs X ou Y influence l'autre, ou encore que X et Y sont influencées simultanément par un autre phénomène.

  • Classification

Classifier des données, c'est regrouper automatiquement des individus en groupes (des classes) homogènes (dont les membres se ressemblent beaucoup). L'idéal est que la dispertion des caractéristiques au sein d'un même groupe soient très proches, et que l'écart entre les membres de deux groupes différents soit grands.

- qualitative : exprimée par la une description naturelle du langage (ex: une couleur)

- quantitative : exprimée par des nombres (ex: une taille)

  • Séries temporelles
Les variations de la température globale de la terre au cours des années constituent une série temporelle
Les variations de la température globale de la terre au cours des années constituent une série temporelle

Faire des statistiques sur une courbe constituée des réalisations successives d'une même variable au cours du temps, est une discipline qui a ses spécificités.

Un exemple: les variations de températures au cours du temps.

  • Compression statistique

Compresser des données, c'est trouver un ensemble de variables Y_1,\ldots,Y_K qui contiennent presque autant d'information que les variables X_1,\ldots,X_N (avec K beaucoup plus petit que N). On utilise aussi le terme de réduction de la dimension.

Il s'agit de compression statistique lorsque la façon de quantifier l'information que l'on veut conserver, et la méthodologie de compression proviennent des statistiques.

L'Analyse en composantes principales est une méthode de compression, au même titre que l'Analyse en composantes indépendantes.

Ne pas hésiter à apporter des précisions et des corrections à cette refonte qui ne doit pas être l'oeuvre d'une seule personne. HB 6 juillet 2006 à 11:21 (CEST)

[modifier] Un point de vue

Point de vue de celui qui prend le train en marche, après pas mal de boulot de fait ! Je trouve la première partie de l'article pas mal, simplement la notion de statistique mathématique est difficile à justifier. Actuellement, les statistiques ou la statistique sont une branche des mathématiques appliquées. Que l'on fasse de l'inférentiel ou de la description, on passe par les mathématiques. Par exemple, l'analyse de données est essentiellement descriptive et l'analyse de variance surtout inférentielle mais elles reposent toutes les deux sur le modèle linéaire c'est à dire sur la géométrie des espaces vectoriels et l'algèbre. Cela se ressent particulièrement dans la partie 4 ou le §4.4 est finalement assez redondant avec les précédents. On pourrait le supprimer. Dans l'historique, faut pas oublier Fisher et Kolmogorov s'il n'y a que deux noms à rajouter. Si on veut charger d'avantage, on peut ajouter Rao et chez les anciens Spearman, Pearson et Galton. Dans les développements récents on pourrait indiquer le modèle linéaire généralisé, les GAM et les méthodes de régression non paramétrique (splines de lissages, régression locale,...) mais ce sera long de rédiger les articles... Pour mon édification personnelle, je croyais que les bayésiens et néobayésiens étaient résolument subjectivistes. Je me trompe ? Au total, je trouve l'article plutôt agréable à lire et qu'il donne une idée assez juste de la discipline. --Jspierre 1 septembre 2006 à 17:54 (CEST)

[modifier] Bon article, proposition d'amélioration

Bonjour,

Je trouve que l'article est bien, mais plutôt pour décrire les "statistiques mathématiques" et par ailleurs il s'insère parmi un certain nombre d'articles parfois ambigus parfois incomplets. Je m'explique.

Tout d'abord, le sens le plus commun du mot statistiques, c'est à dire "ensemble de données chiffrées ou plus généralement quantifiées", (c'est un essai je ne dis pas que c'est ce qu'il faut mettre), est absent de cet article ce qui ne me semble pas normal.

Ensuite, il y a, comme souvent, un problème de vocabulaire, mais il me semble qu'il est plus aigu qu'ailleurs parce que le mot "statistiques" signifie des choses différentes, mais cependant proches :

  • pour commencer le problème du pluriel.. et de l'article devant le mot: si "les statistiques" peuvent avoir a peu près tous les sens ci-dessous, ce n'est pas le cas de "des statistiques ou "la statistique" ou "une statistique"
  • "statistique(s)" me semble avoir au moins trois sens :
  1. le sens courant d'ensemble de chiffres
  2. le sens de la discipline mathématique
  3. dans la discipline mathématique, une fonction mesurable dans un modèle statistique

Je crois que ces différents sens peuvent faire l'objet d'un article d'homonymie.

Par ailleurs certains articles dans lesquels s'insère cet article posent problème :

  • l'ébauche de l'article "statistique" (au singulier) ne prend pas clairement le sens 3,et fait référence à l'article population
  • l'article "population" commence par le sens statistique au lieu du sens courant qui pourtant occupe tout le reste de l'article
  • l'ébauche de "statistique mathématique" n'oppose pas clairement, comme ça devrait l'être, statistique descriptive et statistique inférentielle, fait un retour sur les fonctions de répartition (qui appartiennent aux probabilités "pures"), passe du sens 2 au sens 3, ...
  • l'ébauche de "inférence statistique" peine à définir son objet.

Enfin l'article lui-même comporte des défauts, par exemple il ne me semble pas qu'un statisticien ait pour tâche de "surveiller d'autres travailleurs", ou encore l'approche du mot modèle devrait être plus complet.

La critique est facile, et je sais que je devrais essayer d'améliorer ça de mon côté, cependant une discussion préalable me semble une bonne idée. Voici mes propositions :

  • écrire un article (court) qui donne le sens courant de "statistiques"
  • écrire un article "modèle probabiliste", en tant que modèle mathématique aléatoire
  • compléter l'ébauche "inférence statistique" et y fondre les parties de "statistiques mathématiques" qui ne posent pas de problème. Appuyer fortement cet article sur "modèle probabiliste"
  • renommer "statistiques" en "statistique(s)_mathématique(s)" (en effet, selon moi les statistiques descriptives font partie des statistiques mathématiques)
  • créer une page d'homonymie où le problème du pluriel est évoqué.

Merci de vos suggestions et critiques. Bertrand 24 septembre 2007

[modifier] Statistiques confirmatoires ?

Désolé si la question semble bizarre, mais je n'ai jamais eu l'occasion d'étudier le sujet dans une autre langue que l'anglais. Parle t-on vraiment de statistiques confirmatoires ? Ne devrait-on pas plutôt parler de statistiques confirmatives ? --Sixsous  9 octobre 2007 à 16:48 (CEST)

[modifier] Fusion Utilisation des statistiques en sciences sociales et Statistiques

Bandeaux sur un des articles sans entrée ici. Jerome66|me parler 20 novembre 2007 à 13:35 (CET)

je demande la fusion car des stats ça reste des stats. l,article spécifique aux sciences sociales ne dit pas grand chose... La bibliographie n,a rien a voir avec le texte de l'article ... POur l'instant il me semble plus instructif de fusionner les 2 articles, Ainsi on retrouverait sous statistiques, l'usage en sc. sociales. Et peut- etre, quelqu'un daignera en faire un paragraphe utile ... Comme ca , les gens peuvent au moins comprendre ce que sont les stats--Idéalités (d) 24 novembre 2007 à 15:33 (CET)
Fait Jerome66|me parler 29 novembre 2007 à 21:08 (CET)

[modifier] Fusion abandonnée entre Statistique et Statistiques

  • Sur Statistiques : « La statistique (par opposition à une statistique), etc. Les statistiques (au pluriel), etc. », le dernier lien renvoyant vers « statistique » (au singulier). L'article lui-même parle alternativement de « statistiques » et de « statistique ».
  • Sur Statistique : « Une statistique (par opposition à la statistique), etc. », le dernier lien étant écrit au singulier et renvoyant vers l'article au nom pluriel. Un paragraphe plus loin, la page parle aussi de « la statistique », puis au troisième paragraphe des « statistiques ». Dans la section « Voir aussi », on a un lien intitulé « Statistique » et renvoyant vers « Statistiques ».

Tout cela est confus. Avant de regarder WP, je savais la distinction entre « statistique » et « statistiques »; après, c'est devenu plutôt confus. Euh ?

Il faudrait donc, à mon avis, intégrer ce qui est récupérable de la page Statistique dans l'article Statistiques, puis transformer « Statistique » en redirection vers « Statistiques ».

C.P. 4 janvier 2008 à 16:26 (CET)

Bonjour, Amha , en étant que professionnel du domaine, l'existence des deux articles semble justifiée. Cordialement. Acetone (d) 4 janvier 2008 à 17:24 (CET)

A l'heure actuelle (et indépendamment du fait qu'il pourrait bien sûr y avoir deux articles portant sur des choses différentes), les deux articles couvrent effectivement de manière assez confuse le même champ. Je suppose que les deux articles demandés par Acetone seraient (la) statistique (singulier ou pluriel) d'une part, c'est-à-dire le domaine des maths, et (une) statistique, de l'autre, c'est-à-dire l'ensemble de données. S'il y a assez de matériel pour laisser deux articles, il me semble qu'il sera plus clair de faire une page d'homonymie pour expliquer cela. Cordialement, --Cgolds (d) 4 janvier 2008 à 17:41 (CET)

Je suis d'accord avec Acétone là. Deux articles semblent justifiés on parle de deux choses différentes. Stats au pluriel pour le domaine des maths. Une statistique au singulier pour la fonction des observations. (En fait je suis pour laisser tel quel vu que c'est précisément le cas maintenant) godix (d) 4 janvier 2008 à 20:20 (CET)

(En réponse à Godix (d · c · b) :)

« En gros c'est vrai que statistique peut dans les deux cas être soit au pluriel soit au singulier et ce qui fait surtout la différence c'est l'article indéfini pour une statistique (la fonction des observations) ou les statistiques (l'ensemble des méthodes) et le contexte qui font la différence mais il me parait plus logique de conserver le titre de ces deux articles tels qu'ils sont partant du principe que l'on emploie plus souvent le terme de stats pour parler de l'ensemble des méthodes et d'une stat pour parler de la fonction des observations. En tout cas je trouve qu'il y a matière à faire deux articles complets sur ces deux sujets et je ne pense pas que la fusion soit la meilleure option pour l'immédiat... »

Vu la transformation de l'article « Statistique », on peut en effet renoncer à la fusion. Cependant, le titre des articles reste ambigu, et il serait judicieux de faire une page d'homonymie nommée «Statistique», plutôt que différencier les deux articles par la seule marque du pluriel, différence qui n'est pas toujours pertinente, comme tu l'as relevé. Sinon, on va se trouver avec des liens intitulés « Statistique(s) » pointant vers le mauvais article, et des lecteurs qui ne trouveront pas ce qu'il cherchent. Voici ce que je propose :

  1. renommer « Statistique » en « Statistique (variable aléatoire) » (ou tout autre titre convenable) ;
  2. faire de « Statistique » une page d'homonymie dirigeant le lecteur vers les articles Statistiques, Statistique (variable aléatoire), et éventuellement Statistique mathématique, etc.

(Notez que cette méthode a l'avantage non seulement de guider le lecteur, mais en plus de l'informer des différents sens du mot « statistique ».)

C.P. 5 janvier 2008 à 19:51 (CET)

Je propose ceci :

Conserver les deux articles Statistique et Statistiques et indiquer en haut de chaque page l'existence de l'autre par la formule "homonymie" ou "ne pas confondre" ou "voir aussi" car les termes sont quand même lié au même domaine ; et cela sans créer de page d'homonymie en plus. Acetone (d) 5 janvier 2008 à 20:04 (CET)

Je voudrais encore attirer votre attention sur le fait que les deux sens du mot existent au singulier comme au pluriel (la statistique mathématique ou les statistiques mathématiques existent pour désigner le domaine des maths ; idem évidemment pour l'autre sens). Je recommande donc vivement une page d'homonymie. A l'extrême rigueur, adopter statistiques pour le domaine et indiquer sur l'autre article que le mot au singulier lorsqu'il désigne un domaine des maths est traité à la page 'statistiques'. Je ne comprends pas le titre Statistique (variable aléatoire). --Cgolds (d) 6 janvier 2008 à 02:16 (CET)
une statistique est une va (en théorie) mais bon c'est vrai que le titre est pas forcément le meilleur vu que c'est pas forcément très fécond de voir une stat comme une va. Quitte à renommer autant renommer en (une) statistique même si je suis pas très chaud pour renommer vu que l'usage est de dire stats au pluriel pour le domaine et au singulier pour la fonction. (enfin excepté les exceptions biens sur sinon ça ne serait pas drôle Sourire) Pour le domaine en théorie c'est les statistiques. La statistique mathématique c'est un sous domaine des stats en fait, avec la stat descriptive et l'add d'où les stats au pluriel pour désigner le domaine.
Enfin bon pour en revenir au problème j'ai mis un bandeau confusion sur les deux pages pour rediriger les confusions possibles un avertissement spécifique sur la page statistique et qques mots sur la page stats. Est ce que ca vous va?godix (d) 6 janvier 2008 à 09:48 (CET)
Le titre « (une) statistique » n'est pas admissible. Voir Aide:Homonymie pour les conventions de nommage en cas d'homonymie. —C.P. 6 janvier 2008 à 14:40 (CET)

Pour ma part je trouve cette solution avec ces avertissements très bien. Acetone (d) 6 janvier 2008 à 12:45 (CET)

Idem, merci, godix ! --Cgolds (d) 6 janvier 2008 à 13:55 (CET)