Discuter:Inférence bayésienne

Un article de Wikipédia, l'encyclopédie libre.

L'exercice D'où vient ce biscuit ? sera complété de sa formulation bien plus simple en weight of evidence lorsque je maîtriserai un peu moins mal l'écriture des formules mathématiques :o( François-Dominique 11 sep 2004 à 23:05 (CEST)

Sommaire


[modifier] Neutralite de l'article

La phrase suivante se trouvant dans l'article inférence bayésienne me parait sujette à discussion par rapport au concept de neutralité :

Là où elle coûte cher à obtenir, ce seront des sociétés privées qui les financeront. Et aucune société privée n'aime donner à ses concurrents des informations qui lui ont coûté cher à obtenir, ce qui est humain.

Cette phrase est à peu près celle qu'emploie Myron Tribus, ancien directeur du développement chez Xerox, professeur émérite de théorie de la décision à l'université de Darmouth et auteur du livre Décisions rationnelles dans l'incertain. Je la modifie cependant afin d'éviter l'ambiguïté signalée. 81.64.199.51 15 jun 2005 à 00:31 (CEST)

a) il n'est pas certain que les recherches chères soient nécessairement le fait du secteur privé. et, au regard des siècles sinon de l'histoire récente, le point de vue inverse peut tout aussi bien être appuyé.

b) le partage du savoir obéit à des règles beaucoup plus complexes que ce que suggère la deuxième phrase citée.

c) enfin, l'appréciation ce qui est humain n'a pas non plus sa place dans une encyclopédie.

d) de toute manière, même si la phrase citée était incontestable (ce qu'elle n'est pas), elle n'a pas grand chose à voir avec un article, par ailleurs fort bien torché, sur l'inférence bayésienne.

Je préfère ne pas amender moi-même l'article pour le moment et laisser à l'auteur originel le temps et le soin de tenir compte (ou non) de mes remarques.

--80.201.81.80 9 jun 2005 à 18:41 (CEST) Marc M., Bruxelles (be)



[modifier] Commentaires sur l'article

Je pense que l'affirmation suivante est fausse : L'inférence bayésienne ne permet jamais d'atteindre la certitude, mais de remettre à jour en permanence le degré de plausibilité de chaque élément considéré.

Heu ? Quand on affirme qu'une négative est fausse, n'est-il pas plus clair d'indiquer à la place la positive que l'on trouve vraie ? 81.65.27.14 31 août 2005 à 10:52 (CEST)

Je peux très bien imaginer une situation où on a deux hypothèses, et l'une se révèle impossible à réaliser en vertu des données mesurées. Dans ce cas, il est possible d'atteindre la certitude sur la véracité de l'hypothèse concurrente.


Au sujet de la différence entre les statistiques classiques et les stats bayésiennes, j'ajouterais, mais on peut en discuter avant, que le concept de test statistique de fonction de vraisemblance sont mal définis. Le test statistique se base sur la probabilités d'événements non-mesurés, ce qui est absurde puisque cela suppose de l'information qu'on a pas. La fonction de vraisemblance, de son côté, fait l'hypothèse implicite que tous les paramètres sont équiprobables, ce qui dans plusieurs situations peut se révéler faux. Pour le reste, je suis assez d'accord avec l'idée que l'analyse bayésienne nécessite des efforts supplémentaires qui peuvent être superflus pour les problèmes standards, ceux pour lesquels les incohérences des stats classiques ont peu d'influence. L'avantage majeur réside, à mon avis, dans la capacité de traiter des problèmes complexes de manière formelle : on pose le problème et on applique les règles, sans avoir recours à des tours de passe-passe.

Il n'existe pas d'hypothèse d'équiprobabilité en méthodes bayésiennes. Il y a choix parmi toutes les distributions a priori respectant les contraintes de celle, toujours unique, qui est d'entropie maximale et contient donc le moins d'"information (parasite) ajoutée 81.65.27.14 31 août 2005 à 10:54 (CEST)

Côté présentation, je garderais la partie sur l'évidence et la notation en dB pour une section ultérieure, car c'est accessoire. Les concept importants me semble être plutôt les règles formelles de la théorie des probabilités : loi d'addition et de multiplication.

Enfin bref, faites moi savoir si des modifications en ce sens vous semble raisonnables.

Cordialement,

Huard

Ce changement ne serait pas à mon avis une bonne idée. L'intérêt de la notation de Good est que la relation de Bayes y devient additive et indépendante des priors, ce qui est impossible avec la notation sur [0,1]. En fait, tous les systèmes bayésiens que je connais travaillent en décibels, ce qui leur permet sans sacrifier un iota de précicion de les rendre 1) rapides 2) faciles à coder et maintenir 3) très faciles à surveiller pendant qu'ils sont dans des phases de convergence (apprentissage) dans le cas de réseaux bayésiens. En fiabilité, où on est obligé utiliser aussi beaucoup les mathodes bayésiennes, il n'est d'ailleurs guère possible de travailler lisiblement avec autre chose que des décibels. 81.65.27.14 31 août 2005 à 10:52 (CEST)

[modifier] Lien externe mort

Bonjour,

Pendant plusieurs vérifications automatiques, un lien était indisponible. Merci de vérifier si il est bien indisponible et de le remplacer par une version archivée par Internet Archive si c'est le cas. Vous pouvez avoir plus d'informations sur la manière de faire ceci ici. Les erreurs rapportées sont :

Eskimbot 31 janvier 2006 à 05:03 (CET)

[modifier] Pb ac l'exemple de la femme enceinte

Bonjour!

L'exemple commence par:

on cherche la probabilité p(E)

Puis donne la formule bien connue

 p(E|T_P) = \frac{p(T_P|E)p(E)}{p(T_P)}.

Simplement que dire de cette affirmation:

Remarquez que l'inversion de la probabilité introduit le terme p(E), la probabilité a priori d'être enceinte, souvent appelé le prior. Le prior décrit la probabilité de l'hypothèse, indépendamment du résultat du test. Une femme qui utilise des moyens de contraception choisirait un p(E) très faible, puisqu'elle n'a pas de raison de croire qu'elle est enceinte. Par contre, une femme ayant eue récemment des relations sexuelles non-protégées et souffrant de vomissements fréquents adopterait un prior plus élevé. Le résultat du test est donc pesé, ou nuancé, par cette estimation indépendante de la probabilité d'être enceinte.

Ne cherche-t'on pas plutot a calculer p(E) et non a l'estimer? N'est-ce pas p(TP) qui est le prior? Merci de vos reponses.. Toots5446 19 septembre 2006 à 14:07 (CEST)


Bonjour, L'énoncé du problème étant le suivant : Prenons l'exemple d'une femme cherchant à savoir si elle est enceinte. (...) Le calcul de cette probabilité passe évidemment par l'analyse du test de grossesse.
L'information supplémentaire attendue par notre analyse semble bien être p(E | TP) ; de même l'explication portant sur la détermination a priori de p(E) semble convenable.
Par contre, peut-être quelques informations supplémentaires sur la détermination de p(Tp) seraient utiles. Il me semble qu'on fait souvent appel dans ce cas aux probabilités totales ; mais que dire de p(E) dans le cas général ? (non appliqué à notre cas particulier où cette estimation peut avoir un sens).
Pour le reste, article prometteur, déjà très intéressant, merci.

[modifier] Passage incomprehensible, ou a documenter

Bonjour encore! Je ne suis pas un novice en math, mais je pense qu'a certain passage l'article semble redige par et pour les deja-convertis au domaine. Ainsi certaines references, ou certaines tournures de phrases semblent completement obcure pour quiconque se plonge pour la premiere fois sur le sujet, surtout dans les differences entre statistique classique et Bayesienne.. On a souvent l'impression d'entendre un discour de gens de l'ecole Bayesienne s'expliquant entre eux ces problemes (je suis dans la recherche, je connais ca sur d'autre sujets..)

Exemple:

Le psi-test bayésien (qui est utilisé pour déterminer la plausibilité d'une distribution par rapport à des observations) est asymptotiquement convergent avec le χ² des statistiques classiques à mesure que le nombre d'observations devient grand. Le choix apparemment arbitraire d'une distance euclidienne dans le χ² est ainsi parfaitement justifié a posteriori par le raisonnement bayésien.

Affirmation completement vide pour un neophyte: en quoi la convergence avec le x2 est elle uncritere pertinent? De plus, surtout, le choix d'une distance euclidienne n'est explique nul part et on ne sait pas a quoi il se rapporte..

Aussi, dans la section Annexe historique , on est tout a fait dans le pb: ces rappels sont parfaits pour quelqu'un maitrisant deja le sujet, mais il sort du cadre encyclopedique general (le neophyte).. Ainsi, les propositions 3 et 4 sont completement incomprehensibles sans references:

3 Les probabilités a priori sont souvent dans d'autres méthodes utilisées inconsciemment (critère de Wald, critère du minimax...)

Expliquer les methodes

4 Comme pour tout autre modèle, les effets de différents choix a priori peuvent être considérés de front.

de front...?

En dehors de cela, l'article est plutot bon, merci de votre travail! Toots5446 19 septembre 2006 à 14:20 (CEST)

[modifier] Psi-test

Bonjour, vous parlez du psi-test bayésien. Je travail avec du bayésien depuis plusieurs années et je n'ai jamais croisé ce terme; Pouvez vous donner plus d'information? En fait j'aimerai bien savoir ce qu'est un test en bayésien. En fréquenciste je connais, mais en bayésien ???? Dangauthier 27 février 2007 à 15:03 (CET)

Sinon, vous dites que les 2 approches sont complémentaires. C'est une affirmation très forte. Je trouve pour ma part qu'elles sont théoriquement, philosophioquement et dans les calculs assez en contradiction. En fait le débat fréquenciste/bayésien n'est pas clos et la communaté est très divisée. Je pense donc que l'article devrait prendre du recul sur ce problème avec des phrases du type : certaines pensent que... il est souvent rapporté que.... Dangauthier 27 février 2007 à 15:03 (CET)

PS: pour ma part je suis 100% bayésien, mais il est clair que nous somme une minorité en comparaison du nombre astronomique de gens qui utilisent les test d'hypothèse classiques (souvent sans les comprendre, hélas). Qu'en pensez vous ? (et merci pour votre travail) Dangauthier 27 février 2007 à 15:03 (CET)