Discussion Wikipédia:Validation des articles

Un article de Wikipédia, l'encyclopédie libre.

Note : le texte ci-dessous a été déplacé depuis le Bistro de Wikipédia.

On parle de validation depuis quelque temps et la rumeur est arrivée jusqu'ici : la version 1.4 du logiciel offrira un outil de validation.

Je suis allé le tester (test.wikipedia.org); voici ce que j'ai vu:

1) Seuls les utilisateurs enregistrés peuvent valider un article

2) La validation a lieu pour une version donnée d'un article et a lieu en cliquant sur le lien Valider à côté de Modifier

3) La validation consiste à noter quelques points:

  • Le Style: 5 valeurs de Horrible à Exceptionnel
  • La Légalité: 5 valeurs de Illegal à Légal
  • La Complétude: 5 valeurs de Stub à Extensif
  • Les Faits: 5 valeurs de Suppositions succintes à Solide comme un rock
  • En ordre pour Wikipédia 1.0 (papier): oui ou non
  • En ordre pour Wikipédia 1.0 (CD): oui ou non

4) Le résultat est alors accessible qui donne la statistique pour toutes les versions de l'article.

Je commence à me forger un avis sur ce système (points positifs/négatifs, risques, ce qu'il faut ajouter pour qu'il fonctionne bien...); Je vous encourage à aller le tester et à vous forger votre opinion.

Jyp 19 déc 2004 à 15:02 (CET)

Houlà ! J'espère qu'on aura l'occasion de traduire ça en français avant que ce soit implémenté, histoire de déroger à la mauvaise habitude de Wikipédia en ce domaine. R 19 déc 2004 à 19:52 (CET)
Tout n'est pas traduit, mais tu peux choisir la langue de l'interface dans ton profil sur test. Jyp 19 déc 2004 à 20:04 (CET)
J'ai réagi avant d'aller voir sur test: ce qui s'y passait. Cela dit, c'est bien ce que je craignais : les traductions qui existent sont de bien piètre qualité. D'ailleurs, la possibilité de choisir la langue de l'interface soulève pas mal de questions : si ça doit arriver sur wikipédia, les messages d'interface seront-ils définis par chaque wikipédia, ou de façon globale ? R 19 déc 2004 à 20:10 (CET)
Quelques questions : Quel sera l'impact de ces notes ? (en gros : ça fait quoi au juste ?) Comme chacun peut noter (et modifier note, si j'ai bien vu), a-t-on bien mesuré le risque de croissance rapide de la base de données (plein de "votes" identifiés et stockés, pour chaque article) ? Il faut etre identifié pour voter, mais ça n'est pas un peu un gadget ? Qu'est-ce qui empeche un vandale (oui, ça créé une nouvelle forme de vandalisme !) de créer un compte simplement pour faire n'importe quoi ? Ne faudrait-il pas prévoir un système d'ancienneté ? Traroth | @ 19 déc 2004 à 20:08 (CET)
En plus, on stocke l'historique des modifications de votes de chacun pour chaque article ! A-t-on bien mesuré l'impact sur la base de données ? Bon, la masse de données pour un vote doit etre plutot faible, mais quand meme... Traroth | @ 19 déc 2004 à 20:14 (CET)
Il me semble que ce système de vote n'est pas du tout dans l'esprit wiki. Je crains un peu les effets pervers. Si on l'adopte, il faut un système de méta-validation (validation des validations d'article) que ce soit à la façon de Slashdot, ou par un tri selon l'ancienneté ou les compétences des validateurs. Je suis très circonspect... Serait-il possible que ce système soit testé en grandeur nature sur un seul wiki avant d'être déployé partout ? R 19 déc 2004 à 20:33 (CET)

Je suis plus terre à terre que Traroth, moi je voudrais juste savoir quand on va passer à cette version? Pour moi c'est une bonne idée, mais on aura alors plus besoin de {{ébauche}}, ni de articles de qualité, problème de licence... Peut-être rajouter une question sur le point de vue neutre ou pas, non?--David 19 déc 2004 à 20:26 (CET)

Pas de problème, je vais tester aussi. Je ne pense pas que ébauche disparaisse d'ailleurs. Valider un article ne définit en rien la qualité des articles mais seulement leurs insuffisances. Bon à voir. Un outil de plus. On pourrait aussi noter l'intervenant? son niveau? Melusin 19 déc 2004 à 21:23 (CET)

L'intérêt que je vois est pour les éditeurs de pouvoir faire des tris basés sur les notes de validation pour faire ressortir les articles à améliorer.
Sinon, c'est comme de demander aux élèves d'une classe de se noter mutuellement après une dictée. Les mauvais élèves vont trouver des fautes imaginaires ou il n'y en pas et ne pas voir toutes les vraies fautes. S'il n'y a pas de référence fiable, que vaut l'auto-notation sans contrôle ? Les validations des experts vont être noyées parmi celles de tous ceux qui s'estiment compétents. C'est encore le même débat qui revient... TahitiB 19 déc 2004 à 21:55 (CET)

J'ai été voir et en fait j'aime assez, c'est une bonne idée je trouve. Pour ceux qui ne connaisse pas, il y a un signet (comme "modifier", discussion"...) on fait des croix entre quatre choix (comme l'a dit Jyp) + "pas d'avis" et commentaire possible, et on peut voir un tableau (comme ceux de wikipedia) dans lequel pour chaque question il y a le nombre de votant et le pourcentage (100% c'est bien et 0% c'est mauvais) et il y a un pourcentage total (les pourcentages des 6 questions divisés par 6), et ci l'article change (est amélioré) on peut effacer ses anciens votes. Non, franchement c'est bien (voir maintenant pour l'utilisation qu'on va en faire).--David 19 déc 2004 à 22:20 (CET)

puisque pour tester, il faut s'ouvrir un nouveau compte, y'a-t-il possibilité d'avoir un seul compte sur tous les projets wiki ? Parce qu'entre wiktionnaire, en:, fr:, ko:, wikisource, méta, et maintenant test, je m'y perd. Surtout que le pseudo Archeos n'est pas disponible partout (et je ne parle pas de mes identités alternatives, comme 82.121). C'est impossible, ou pas ?
Cette question avait déjà été demandé, je pense que c'est pas possible car plusieurs personnes peuvent avoir le même pseudo (donc cafouillage), maintenant il est vrai qu'un "compte wikimedia" serait préférable et il faut alors en plus que les personnes partageant le même pseudo discutent pour que l'une des deux (ou les deux) change de pseudo (en rajoutant un suffixe fr:, en: ou de: par exemple)--David 20 déc 2004 à 10:29 (CET)
ce serait pas mal en tout cas, je suis prêt à discuter pour gagner du temps en tout cas. archeos 20 déc 2004 à 11:47 (CET)
« La Légalité: 5 valeurs de Illegal à Légal  » : aaaarrrggghhhh... personne ici (enfin peu, et moi le premier) ne s'y connaissant en droit, on va voir apparaître toutes les idées reçues... 10 contre 1 que lespremières pages à se faire sacquer seront cellede secourisme et de médecine... Cdang | m'écrire 23 déc 2004 à 14:37 (CET)

[modifier] Point de vue utilisateur

Après avoir testé, je pense qu'il y a de bonnes idées dans ce qui a été fait: Style,Légalité, Complétude,Faits. Pour Wikipédia 1.0 (papier) et Wikipédia 1.0 (CD), je me demande comment cela sera géré entre la 1.0 et la 2.0.

Je ne doute pas une seule seconde de la bonne volonté et du travail fourni par les développeurs.

Mais j'ai un peu peur que le système tel qu'il est soit un peu trop complexe. L'utilisateur devrait pouvoir savoir très facilement (sans rien faire) si la version qu'il lit est validée au niveau qu'il souhaite. Ce qui n'est pas la cas actuellement.

Par ailleurs (de mon point de vue), ce qui compte n'est pas la quantité de personnes qui ont validé un article, mais la qualité de ces personnes. La qualité étant de mon point de vue relative au domaine. Il serait donc bon de voir qui a validé une révision d'article, ce qui n'est actuellement pas le cas.

L'utilisateur consultant ne connaissant pas nécessairement tous les wikipédiens rédacteurs, un système d'alliance d'utilisateurs pour faire des validations par groupes aurait peut-être été plus efficace. Il s'agit là d'une idée vague imprécise, peut-être à développer. Ceci demanderait un travail de développement supplémentaire, mais faciliterait la vie de l'utilisateur: l'article linux a été validé par le groupe informatique. L'article Turquie a été validé par le groupe géographie1, mais pas par géographie2; ou bien l'article 35 heures a été validé par le groupe gauche mais pas par le groupe droite, ou le contraire; on pourrait ainsi retrouver des groupes d'interet partisans. L'un des problèmes principaux serait l'adhésion d'un utilisateur à un groupe...

C'est vrai qu'on perd ici une des forces de W:, l'identification des auteurs, et la neutralité de point de vue. Le système de validation tel que présenté n'est pas neutre, il aboutit à présenter une moyenne de points de vue ; par exemple, sur Génocide arménien, il risque d'y avoir une note moyenne entre 2 et 3 si tout le monde peut voter. archeos 20 déc 2004 à 10:07 (CET)
En fait, il faudrait pouvoir autant discuter de la validation que de l'article lui-même. Je crois que la croissance de l'encyclopédie va être ralentie, ce qui va relancer le débat approfondissement/agrandissement, mais dans l'autre sens cette fois. Il faudrait également pouvoir établir un historique de la validation, pour que la discussion s'établisse sur des bases saines. archeos 20 déc 2004 à 10:22 (CET)
Effectivement, c'est un point qui m'inquiète; la note de l'article et sa valeur sera définie à la minorité. Cela risque de pousser les adeptes de sectes a venir s'inscrire nombreux pour que l'article défavorable ait une mauvaise note, ou que l'article favorable en ait une bonne. De même le point sur la légalité, un article est ou n'est pas illégal: voter pour le savoir est pour le moins étrange.
Plus généralement, il y a deux chose: le mécanisme de notation qui est plus ou moins en ordre; le choix des votants: on nous reproche l'absence de comité de validation et surtout (erronément) de présenter l'avis majoritaire, et ce dernier point me semble amplifié avec le système (note: dans un forum genre slashdot où l'on juge l'intérêt d'un article, il n'y a pas de problème, mais là on demande de juger de la pertinence, de l'extensivité et de la légalité d'un article).
En fait, la question est vraiment: ok, pour un ou plusieurs groupes notant un article, mais comment en définir les membres pour garder 1) les principes fondamentaux (NPDV) 2) la pertinence de la note 3) la diversité des opinions¨
Pas facile comme problème. Jyp 20 déc 2004 à 10:53 (CET)

Pour moi, un système de validation n'a d'intérêt que pour dire qu'une version donnée d'un article est jugée acceptable par une personne considéré compétente sur le sujet. Pour ça, une note suffirait (pertinence de l'article). Tout le monde pourrait voter (opinion générale), mais on pourrait afficher la liste des versions d'articles répondants à certains critères : version ayant une note supérieur à X donnée par A, B et C. Ca reviens un peu au système des groupes, mais sans le cote adhésion qui me semble personnellement une mauvaise idée. Personnellement, je suis pour essayer le système qu'on nous propose. Je pense qu'il a été réfléchi et qu'il a peut-être des intérêt qu'on ne saisira qu'a l'usage.
Pour rappel, papoter ici ne sert pas à grand chose. C'est sur la liste de discussion international (ou la liste technique) qu'il faut discuter si on veut être entendu (ce qui semble normal pour un projet international). Aineko 20 déc 2004 à 13:25 (CET)

Un petit lien, vers la page de discussion pertinente ? --[[Utilisateur:Aldoo|Aldoo\u2709]] 20 déc 2004 à 14:53 (CET)
No, I wrote it here, because I assume the international page are not in french. If the idea is good, it will be translated by someone someday.
Je n'arrive pas à accéder à la page de validation. Qui peut m'aider ? --Alain Caraco 21 déc 2004 à 12:31 (CET)
Tu t'es identifié ? archeos
Je n'avais pas réalisé qu'il fallait le faire. Je viens de m'identifier et ça marche. Merci. --Alain Caraco 21 déc 2004 à 21:49 (CET)

Il y a deux alternatives, ou bien on admet que la qualité des articles tend vers une asymptote par le simple fait que les éditeurs successifs améliorent l'article, ou bien on met en place des systèmes de validation ce qui implicitement revient à dire que les éditeurs n'ont pas tous les mêmes droits. Si ce deuxième point est acquis, alors on peut discuter du qui et du comment. Sinon on tourne en rond parce qu'une partie de la Communauté a choisi la première option. Je suis partisan de la deuxième option et je pense qu'un système peut très bien être expérimental. Il est probablement possible de désigner une partie de Wiki en tant que zone d'expérience (au hasard : la catégorie « Religion et Croyances ») et de faire des statistiques au bout de 6 mois ou d'un an sur le nombre d'éditeurs pour voir si le système de validation en décourage certains.--AnTeaX 21 déc 2004 à 17:12 (CET)

[modifier] Validation et audit interne

Note : le texte ci-dessous a été déplacé depuis le Bistro de Wikipédia.

Pour évaluer l'efficacité de la correction d'erreurs avec un système collaboratif, est-ce que quelques personnes (par ex les admins) ne pourraient pas introduire volontairement des erreurs factuelles (une date légèrement fausse, un nom de personne incorrect, une erreur de taxonomie, ...) pour savoir au bout de combien de temps ces erreurs seront corrigées ? (au lieu de parler dans le vide des vertus et défauts de la méthode W).Bien sur, il faudrait introduire ces erreurs avec de réels ajouts, histoire de ne pas trop éveiller l'attention. D'ailleurs je pense qu'un jour ou l'autre un journaliste (Charlie-Hebdo, Que Choisir, Science et Vie ...) va nous faire ce coup là et écrire un article un mois plus tard en critiquant la qualité de Wikipédia. TahitiB 21 déc 2004 à 09:11 (CET)

Il vaudrait mieux détecter les erreurs existantes plutôt que d'en introduire volontairement. N'y a-t-il pas assez à faire ? Spedona 21 déc 2004 à 09:21 (CET)
La politique de l'autruche? :-) Non, je pense que c'est une bonne idée. Parce qu'on raconte un peu partout que les erreurs sont corrigées, mais mon expérience wikipédienne me dit que ça n'est que rarement le cas (les personnes compétentes sur un sujet ne lisent pas les articles correspondant car elles n'ont rien à en tirer, et/ou elles ne savent pas modifier un article, etc). Il faudrait donc qu'une petite expérience secrète soit menée, sur une période d'un an, par ex. 10 erreurs grossières, 10 erreurs moyennes et 10 erreurs discrètes pourraient être introduites par des IP dans des articles très suivis, moyennement suivis et peu suivis. Toutes les semaines, hop, suivi des corrections, et on verrait bien à quel rythme sont corrigées les erreurs. Bien sûr, il n'aurait pas fallu discuter de ça sur le bistro ;-) Arnaudus 21 déc 2004 à 09:26 (CET)
Très bonne idée à mon avis. Ca permettrait de savoir vraiment où on en est. saXon 21 déc 2004 à 10:24 (CET)
Comme l'histoire du plastic dans la valise ? ;-) Didier 21 déc 2004 à 10:59 (CET)
Donc ne pas oublier de noter les modifs sur une feuille volante ;-) greatpatton 21 déc 2004 à 11:46 (CET)

Je persiste à dire que ce n'est pas une bonne idée et un mauvais exemple. C'est un moyen détourné de reposer la question de validation des articles, mais est-ce la meilleure ? Si elle n'est pas concluante, quelle conséquence en tirera-t-on ? Je pense qu'on pourrait inviter les contributeurs à relire attentivement les articles signalés comme étant de qualité pour conforter cette qualité. Qu'au moins on ne soit pas attaquable sur la vitrine. Spedona 21 déc 2004 à 11:11 (CET)

Autant je suis partisan d'une validation des articles autant introduire de fausses infos afin d'arriver à prouver que les corrections ne se font pas(c'est quand même l'idée qu'il y a derrière la proposition de TahitiB ) me parait je pèse mes mots franchement scandaleux et manipulatoire. la réponse de Spedona me semble la bonne. Si un journaliste apprend qu'on introduit des fausses information je vous dit pas la crédibilité......Lucas thierry 21 déc 2004 à 11:25 (CET)
C'est une idée que je trouve curieuse. Un peu comme de semer des mines pour voir si elles explosent. Cela dit, et c'est ce point que je voulais souligner, pourquoi faudrait-il que ce soit specifiquement des admins qui se chargent d'un test comme celui-là? Je crois utile de répéter, et répéter encore, que les sysops ne sont pas les gardiens du temple et que, si une confiance particulère leur est accordée par la communauté pour quelques possibilités techniques supplémentaires (effacer/restaurer+bloquer), je ne vois rien dans la proposition qui les rend nécessaires. villy 21 déc 2004 à 11:51 (CET)
Ca s'appelle une expérience, et n'importe qui peut comprendre ça. Les modifications seront répertoriées quelque part, et elles seront révertées quand l'expérience sera terminée. Une centaine d'erreurs parmi les dizaines de milliers existant déja dans wikipédia ne seraient qu'une goutte dans un océan. De toutes manières, comme le PO le disait si bien, certains vont la faire, si ce n'est déja commencé. Autant qu'on puisse le faire en interne avant eux pour préparer nos réponses. J'ai la nette impression que le sentiment qui domine, ce n'est pas le problème de la crédibilité, c'est la trouille: vous avez peur que l'expérience démontre que le système n'est pas fiable à court terme (ce dont je suis déja persuadé, mais l'argument revient toujours pour contrer les critiques). Vous rendez-vous compte de l'importance des résultats d'une telle expérience? On pourrait avancer des chiffres : erreur corrgée en moyenne en 15 minutes sur les articles de qualité, etc... Arnaudus 21 déc 2004 à 11:48 (CET)
Exactement. C'est une expérience, comme les médecins donnent des médicaments placebo inefficaces à des gens malades pour comparer avec l'efficacité de nouveaux médicaments . Ça ne provoque pas de scandale.
Limiter ça aux admins permet d'eéviter que le test se généralise de manière anarchique (parce que c'est quand même quelque chose aà manipuler avec prudence). TahitiB 21 déc 2004 à 11:55 (CET)
Pour ma part, je sais d'expérience que je pourrais introduire des erreurs dans les articles de philosophie sans que cela soit remarqué. Dans un certain nombre de domaines, la Wikipédia n'a pas assez de contributeurs pour garantir la fiabilité des connaissances, et je suppose qu'elle ne résisterait pas ou mal à des introductions malveillantes d'erreurs pourvu que cela soit fait avec assez de subtilité. Caton 21 déc 2004 à 12:25 (CET)
mais c'est n'importe quoi, relisez, reliser une page au hasard, donnez vous un domaine de compétence, faites de votre mieux, et basta, y'a rien à prouver, la version anglaise l'a déja fait, et laissez les journalistes aboyer si ils veulent, on n'a rien à prouver on existe c'est tout, et puis les nouveaux, faites un effort pour faire un article pertinent en pensant à ce que vous aimeriez trouver dans une encyclopédie. jeffdelonge 21 déc 2004 à 13:32 (CET)
Ah, que voilà une réaction pleine de bon sens. Il a bien assez d'erreurs involontaires sans en ajouter de nouvelles. heMmeR 21 déc 2004 à 13:41 (CET)
Je suis assez d'accord. Que chacun de nous améliore concrètement les articles, en créer... c'est vraiment ce qu'il y a de mieux à faire AMHA, le reste suivra... Kelson 21 déc 2004 à 13:45 (CET)

Cette expérience a déjà été faite, je me souviens avoir lu un blog ou une news qui rapportait les résultats. C'était en anglais. Marc Mongenet 21 déc 2004 à 13:26 (CET)

Marc Mongenet : il s'agissait probablement de ce blog + [1] - The Isuzu Experiment - et ce blog - Freedom to Tinker (tenu par w:en:Edward Felten). Je mentionne que je suis aussi d'accord avec l'intervention de Caton ci-haut (il y en a d'ailleurs déjà beaucoup d'articles qui, par la force des choses, se trouvent dans un tel état)... Patrice Létourneau 21 déc 2004 à 15:38 (CET)

Je suis assez daccord avec jeffdelonge: cette discussion sur la qualité de wikipédia n'a pas beaucoup de sens... On existe, il y aura toujours des gens passionnés et volontaires pour participer comme nous le faisons, et voilà! Nos limitations on les connait, le fait qu'on ne garanti aucunement la véracité d'un article à un instant donné on le connait et on l'assume parfaitement, je ne vois pas pourquoi on s'emmerderait à essayer de justifier ça auprès des journalistes. Même si on faisait une telle mesure du taux de rapidité dans la correction, ça n'aurait pas grand sens car le résultat n'aura rien à voir par exemple sur des articles hyper-sensible et sur des articles hyper spécialisés auxquels seul un infime quantité de contributeurs s'intéressent... Bref je vois pas trop l'intéret de cette idée. .: Guil :. causer 21 déc 2004 à 16:27 (CET)

Il suffit d'aller voir les réponses faites aux détracteurs de Wikipédia: "Oui, des gens peuvent vandaliser, mais c'est pas grave parce que c'est tout de suite corrigé". Le problème, évidemment, c'est que c'est faux. La question, c'est un peu "faux à quel point"? Et une telle expérience permettrait de le préciser. Il suffirait de distinguer l'importance de l'erreur introduite et le type de page concernée (ébauche, article de qualité...). Ca permettrait d'avoir des chiffres: "début 2005, une erreur grossière était réparée en moyenne en 10 minutes sur un article de qualité, 2 jours sur une ébauche. Une légère erreur introduite dans un tableau de données est corrigée dans 80% des cas...". Ca, ça permettrait de répondre aux critiques. Ou alors on laisse tomber les argumentations vaseuses, parce qu'un jour ou l'autre, quelqu'un de bien moins intentionné risque de tenter l'expérience sans pour autant prendre les précautions de rigueur (restauration après l'expérience, réflexion sur les thèmes touchés --par ex. éviter la liste des champignons commestibles :-) ). Arnaudus 21 déc 2004 à 17:00 (CET)
Et combien d'articles faudra-t-il saboter pour que l'échantillon soit statistiquement représentatif ? heMmeR 21 déc 2004 à 17:22 (CET)
et parce qu' à l'instant "T" nous saurons qu'il faut 2 jours pour réparer une erreur celles-ci vont être "réparée" plus vite? l'argument de Caton sur la philosophie est valable pour la plupart des domaines un peu spécialisé ou travaille une seule personne ou presque. Le risque que des erreurs traînent pendant des mois est moindre quand il y a plusieurs contributeurs qui "se surveillent" mutuellement en travaillant de concert ou quand existe un projet à plusieurs. La moindre modif est alors commentée et disséquée. (je viens d'en faire l'expérience sur l'article Ptolémée XV avec Aoineko, c'est aussi le cas sur le projet mythologie grecque pour ne donner que des cas perso). Aussi plutôt que de se lancer dans des "tests" bidons de sabotage qui n'apporteront pas grand chose (amha) il serait bon d'arriver à une situation où sur chaque thème il y ait plusieurs contributeurs identifiés (la notion de projet est primordiale). La question de savoir si certains sont plus spécialistes que d'autres est alors secondaire car il y souvent émulation. Bon c'est sans doute à l'heure actuelle un voeux pieux mais probablement le moyen le plus sur de mettre en place un système efficace de limitation et de correction des erreurs Lucas thierry 21 déc 2004 à 19:09 (CET)
Rien à ajouter (voir le paradoxe du menteur) GL 21 déc 2004 à 19:57 (CET)

Une solution simple pour faire cette « expérience » sans « poser des mines » :

  1. Demander à des contributeurs d'avertir lorsqu'ils corrigent une erreur de ce genre,
  2. regarder l'historique,
  3. faire des statistiques, des observations et tout le toutouin.

On peut tout faire à partir de l'historique, il y a les dates et les modifications. On peut suivre les vandalismes, les corrections, les corrections mineures, etc. Bref, pas besoin de vandaliser pour les besoins de la cause... NoJhan 21 déc 2004 à 19:19 (CET)

Ok, déontologiquement parlant, c'est pas joli d'introduire des erreurs. en fait il suffirait de ne pas corriger quelque unes des erreurs détectées et de voir combien de temps encore s'écoule avant leur correction. C'est complètement passif et invisible. Finalement peu importe, tout le monde a conscience qu'il y a encore beaucoup d'efforts à faire dans le meilleur des cas. TahitiB 21 déc 2004 à 19:24 (CET)
Méthodologiquement c'est moins propre. GL 21 déc 2004 à 19:57 (CET)

Je suis vraiment dépité que des contributeurs de l'encyclopédie Wikipédia discutent sérieusement de la possibilité d'introduire volontairement des erreurs dans des articles. Ca ne perturbe pas votre conscience vis-à-vis des lecteurs ? Oui, il y a des tas d'erreurs (parfois volontaires, malheureusement) sur Wikipédia. Oui, elles ne seront jamais corrigées tant que quelqu'un de compétent ne les voient. Il n'y a vraiment pas besoin de faire des expérimentations malhonnêtes pour le savoir. Si les réponses apportées aux critiques ne vous conviennent pas, re-écrivez les. Pour moi, le seul gage de fiabilité que nous pourrions offrir serait un système de validation permettant de connaître la liste des versions d'articles validées par des personnes compétentes en la matière. En attendant que ce soit possible, faisons de notre mieux pour améliorer la qualité des articles et invitons les lecteurs a confronter nos informations avec d'autres sources. Aineko 22 déc 2004 à 06:55 (CET)


Il n'y a pas de raison d'introduire des erreurs volontairement. Il y en a assez: pour faire votre test, repérez une erreur et regardez dans l'historique depuis quand elle est-là. Vous aurez la même information en beaucoup moins de temps. Jyp 22 déc 2004 à 07:27 (CET)
Tout à fait d'accord Jyp. Pour info, je viens d'inscrire dans le Bêtisier une erreur qui se trouvait à la fois dans l'article Wikipédia et dans Encyclopédie. Je n'ai cependant pas fouillé l'historique pour savoir depuis combiens de temps cette erreur subsistait (avis à ceux désirant compiler des statistiques sur le sujet). Patrice Létourneau 22 déc 2004 à 20:23 (CET)

Si quelqu'un se livre à cette expérience destructrice, nous ne pourrons l'en empêcher qu'en étant attentifs à le corriger. Il faut choisir son camp. Si on veut se servir du travail commun comme champ d'expérimentation, on se situe hors du projet et de la communauté à mon avis. D'autre part, rien n'empêche d'analyser systématiquement les modifications naturelles de l'encyclopédie pour repérer celles qui relèvent d'une correction, d'évaluer selon des critères à établir l'importance de l'erreur ainsi redressée et de noter le temps que cela a pris. S'il y a des statisticiens parmi nous, ils auront sans doute des idées là-dessus. Roby 22 déc 2004 à 09:04 (CET)

Comme le fait remarquer Roby il faut utiliser les modifications naturelles, tout tentative d'expérimentation forcé ne peut être que biaisé. Comment pourrait être choisi un échantillon représentatif d'article et d'erreur à y inserer sans y apporter un biais (par exemple en choisissant trop de sujet trés pointues dans l'échantillon) ? Seul les erreurs/vandalisme réel ont une signification. IBM avait fait un étude sur ce sujet, quelqu'un aurait l'url sous la main ? Les liens postés plus haut n'ont pas grande valeur, il ne peuvent mesurer que l'efficacité à corriger les erreurs introduites sans être généralisables à l'ensemble des erreurs. phe 22 déc 2004 à 20:42 (CET)
Au contraire la méthode la plus solide est de choisir au hasard (avec une table de nombre aléatoire) les articles utilisés. Ne travailler qu'avec les erreurs remarquées lors de leur correction introduit un biais : moins un article est corrigé vite, moins il a de chancer de rentrer dans l'échantillon. Malgré ces considérations techniques je suis contre une telle expérience. GL 22 déc 2004 à 22:33 (CET)
Les quelques remarques de l'étude d'IBM (rapport préliminaire) sont sur cette page, à partir de laquelle on peux notamment accéder (lien, en haut) à la page de résultats. Patrice Létourneau 22 déc 2004 à 21:10 (CET)
P.-S. Les indications concernant le vandalisme figurent sur la page « Results ». On prendra cependant soins de remarquer que l'étude d'IBM sur le vandalisme prend comme sujet d'observation des pages dont la thématique est sujet à controverse - donc, on ne peux pas davantage généraliser les résultats. Patrice Létourneau 22 déc 2004 à 21:19 (CET)
Ils ont utilisé des pages sujettes à controverses et d'autres non, IBM vs Abortion par exemple, il y à un minimum de rigueur dans leurs études bien que leur échantillon soient un peu limités. Ils n'ont pas tenté d'intervenir dans le déroulement de l'expérience. Il serait trés intéressant d'avoir les outils logicels qu'ils on utilisé pour faire cela. Il me semble que d'autres études similaires sont en cours/ont eu lieu. Leur approche est correcte, il manque un échantillon nettement plus grand et une visualisation synthétique de l'ensemble des résultats phe 22 déc 2004 à 21:56 (CET)
Mmmm... à ce que j'ai vu, les pages sujettes à controverses et celles ne l'étant pas n'ont pas vraiment été utilisées pour les mêmes fins. Où as-tu vu des résultats différentiels (vs) ? Je suis d'accord qu'il serait intéressant de voir les outils utilisés pour cette étude et plus de détails sur l'échantillonnage... Patrice Létourneau 22 déc 2004 à 22:16 (CET)
Seulement la page results, les patterns sur l'article IBM et l'article Abortion « with each version getting equal space » montre bien une différence entre un article polémique et un beaucoup moins polémique, Assez curieusement l'article Microsoft montre une masse de contributions anonymes. phe 22 déc 2004 à 23:57 (CET)
Lorsque je regarde les History flow de IBM et de Abortion, je vois bien une différence d'activité, mais pas une information différentielle concernant la réactivité à des vandalismes entre article polémique et autres. L'History flow de IBM indique surtout l'évolution de l'article par intégration du matériel de quatre contributeurs, il me semble. D'ailleurs, cette perspective se comprend, puisque l'intérêt de la recherche est justifiée ainsi : « history flow provides answers at a glance to questions like, Has a community contributed to the text or has it been mostly written by a single author? How much has a particular contributor influenced the current version of the document? Is the text's evolution marked by spurts of intense revision activity or does it reflect a smooth transition from its beginning to the present? » ([2], c'est moi qui met les passages en gras). Par exemple, en regardant l'l'History flow de l'article Evolution, on constate qu'il n'est pas resté grand chose de l'apport original ; en regardant l'History flow de l'article Capitalism, on remarque que l'article a dû débuter de manière schématique (ce qui se vérifie d'ailleurs)... Si l'aperçu est rapide, par contre, l'étude rend peu compte de la question des vandalismes subtils et de la perpétuation ou non d'erreurs - et pour cette étape préliminaire de l'étude, il me semble qu'on ne peux pas parler d'analyse fine des données... Pour rappel : en principe l'analyse des données brutes poursuit son cours, les History flow ont été construit à partir du télécharchement de la base de donnée de wikipédia et la visualisation des variations a été implémenté selon les considérations suivantes : «  Finding matching sections of two document revisions is a well-studied problem in computer science, with many possible solutions. For our visualization, we've chosen a simple technique from the 70s. See Heckel, Communications of the ACM, April 1978: "A Technique for Isolating Differences Between Files." The algorithm works by matching up tokens--in our program "sentences" defined as pieces of text delimited by periods or html tags--which gives decent results with fair efficiency. One problem with this approach is that tiny changes, such as the addition of a single comma, will show up as a change to an entire sentence. » (ici, en bas de page). Patrice Létourneau 23 déc 2004 à 05:55 (CET)