Wikipédia:Sondage/Synthèse vocale des articles

Un article de Wikipédia, l'encyclopédie libre.

Il a récemment été proposé sur le bistro de mettre en ligne des versions audio des articles issues d'une synthèse vocale. Depuis, quelques articles ont été synthétisés par cette technique et ajoutés dans les articles. Cependant, la question de l'opportunité de tels fichiers se pose toujours, ainsi que les questions pratiques concernant la mise en place de cette éventuelle fonctionnalité.

Sommaire

[modifier] Problématique

Lors de la mise en place des premiers fichiers générés grâce à une synthèse vocale, de nombreux problèmes sont apparus, les appels de note sont lus comme des chiffres dans le corps de l'article, les onglets modifier sont lus après les différents titres, les tableaux sont incompréhensibles, les puissances sont lues comme des chiffres, les légendes des images ne sont pas contextualisées comme telles... Il est donc nécessaire de modifier les articles en conséquence avant de leur appliquer une synthèse vocale. Il semble que ces modifications puissent être appliquées automatiquement à l'aide d'expressions régulières.

Avant de lancer une réflexion sur la méthodologie à appliquer pour le traitement des articles en vue d'une synthèse vocale, il nous a paru important de procéder à ce sondage pour juger de l'appétance de la communauté envers ce service et donc de l'intérêt de consacrer du temps à le mettre en place.

Deux discussions ont déjà eu lieu sur le bistro, ici et . Il en est ressorti que la solution consistant à proposer directement des fichiers ogg vorbis pourrait être gourmande en bande passante. Cependant, certains ont paru intéressés par l'accès audio au contenu de nos pages. C'est pourquoi nous tentons de formaliser la chose afin de mieux cerner la volonté de la communauté envers cette application.

Pour juger de la qualité de la synthèse vocale ainsi que des problèmes techniques qui se posent pour la mise en forme préalable des articles, vous pouvez consulter ceux qui ont déjà été produits par cette technique dans la Catégorie:Article en synthèse vocale, ils ont été mis en forme manuellement et souffrent donc encore de quelques problèmes, cependant, ils permettent de se faire une bonne idée de la qualité du procédé.

Ce projet ne souhaite pas remplacer le Projet:articles audio, mais plutôt en proposer un palliatif pour les articles ne disposant pas de tels fichiers, les fichiers produits sont catégorisés dans une autre catégorie et proposés par un autre modèle et une autre image que ceux du Projet:articles audio, mais la rapidité de cette technique comparée à celle de la lecture humaine permettrait de déployer rapidement le service en utilisant des outils automatiques ou semi-automatiques pour faire le travail.

[modifier] Pour approfondir le sujet

[modifier] Trois questions

Le vote portant sur trois questions se tient du 17 février au 2 mars.

[modifier] Est-il opportun de créer des versions d'articles optimisées pour la synthèse vocale ?

Les versions créées de cette manière pourraient être mis en sous page et reprendre une version de l'article dans laquelle les éléments parasites à la synthèse vocale seraient supprimés, elles pourraient être mises en lien dans l'article via un modèle qui renvoie vers une explication du fonctionnement des logiciels de synthèse vocale ou par un lien direct vers une application en ligne du type pediaphon (cette solution aurait pour avantage de donner accès à la synthèse vocale sans faire exploser la bande passante utilisée, le traitement s'effectuant sur l'ordinateur du lecteur, seul un fichier texte serait transmis). Les modalités d'application seront mises au point si cette fonctionnalité apparait opportune, la mise en forme de ces versions pourraient être produites et réactualisées régulièrement par bot si des volontaires se manifestent.

[modifier] Oui

  1. +1: accessibilité avant tout. Arnaudus (d) 17 février 2008 à 00:06 (CET)
  2. Oui mais à condition que : seule la dernière version audio soit disponible en streaming ou téléchargement pour tout le monde. Oui, aussi pour une réactualisation si cela est vraiment nécessaire (un ou plusieurs ajout majeurs). J'aimerais la présence d'un bouton sur l'article qui permette de lancer la demande d'un fichier sonore à un robot. Les robots nous ferais surement gagner en efficacité s'ils sont bien éduqués. Par contre je suis contre que le traitement se fasse sur l'ordinateur du lecteur car cela demande beaucoup de temps pour obtenir le fichier son dans la clé USB musicale. Vi..Cult... (discuter) 17 février 2008 à 08:09 (CET)
  3. Si ça vous amuse d'y consacrer votre temps... Il y a de meilleures solutions, mais chacun sa vocation. — Jérôme
  4. + Pour--GarfieldairlinesCause-moi 18 février 2008 à 11:07 (CET)

[modifier] Non

  1. Pas de "version optimisée" (on va se retrouver avec x versions du même article), mais que cela soit la norme pour tous les articles. Tavernier (d) 17 février 2008 à 00:17 (CET)
  2. Non, il faut rester sur une seule version des articles (pour des raisons de simplicité) et qu'elle corresponde à ce que l'on ait actuellement (notes, tableaux, ...). Désolé, mais les autres utilisateurs auraient beaucoup trop à perdre. PoppyYou're welcome 17 février 2008 à 01:29 (CET)
  3. Il vaudrait mieux développer un plugin IE / Firefox qui convertirai à la volée l'article dans une version plus appropriée aux systèmes de synthèse vocale. Okki (discuter) 17 février 2008 à 01:39 (CET)
  4. Avant de songer à fournir une version dégradée, l'existant peut et devrait être amélioré, ce qui apporterait un réel gain d'accessibilité contrairement à cette proposition. --Lgd (d) 17 février 2008 à 07:56 (CET)
  5. Puisqu'il est dit que l'optimisation peut être automatisée, il est bien inutile de passer par un article que personne ne lira quand il suffit de régler ça informatiquement à un autre niveau (logiciel lecteur notamment). TigHervé (d) 17 février 2008 à 08:49 (CET)
  6. C'est la synthèse vocale qui doit s'améliorer et dépendre des articles, pas l'inverse - Shaddam 5 17 février 2008 à 10:48 (CET)
  7. idem ci-dessus. Regardez un exemple simple : sur le site du IHT, on clique sur Listen to Article et ca marche. Pas la peine de demander au journaliste d'optimiser quoi que ce soit --Ofol (moi . ) 17 février 2008 à 11:09 (CET)
  8. Fournir en téléchargement une version spéciale mettrait à l'écart les utilisateurs concernés des dernières révisions de l'article. De plus et surtout, ces utilisateurs sont déjà équipés d'outils (lecteur d'écran+sythèse vocale) qui sont justement conçus pour restituer au mieux les informations contenues dans des pages Web, pour peu qu'elles soient correctement écrites (le mot correctement ici recouvre beaucoup, beaucoup de recommandations Clin d'œil). Comme l'écriture correcte de ces pages profite à un plus grand nombre, il me semble plus judicieux de travailler sur les pages elles-mêmes que sur la production de rendus audio. GillesC →m'écrire 17 février 2008 à 12:21 (CET)
  9. Les contenus de Wikipédia sont accessibles (surtout par rapport au web). C'est comme le dit ThrillSeeker, le logiciel qu'il faut adapter. Certains articles sont déjà difficiles à maintenir, il ne faut donc vraiment pas permettre à tout les articles d'avoir une "version optimisée". De plus, la syntaxe vocale n'est pas pertinente pour tout les articles, alors vouloir une "version optimisée". Manu1400 (d) 17 février 2008 à 18:03 (CET)
  10. il vaudrait mieux améliorer les logiciels en question.--Cattzy (d) 18 février 2008 à 00:07 (CET)
  11. Dans les spécifications du xhtml et du css, il est clairement défini des outils pour les synthétiseurs vocaux. Wikipedia ne doit pas héberger des fichiers sons. Apultier (d) 18 février 2008 à 11:27 (CET)
  12. Idem avis précédents. JSDX (d) 18 février 2008 à 13:32 (CET)
  13. Il existe des logiciels de synthèse vocale, assez au point. Il vaut mieux se concentrer sur l'accessibilité général du site et des articles, plutôt que de créer des articles optimisés pour la synthèse vocale : Tous les articles doivent être optimisés pour la synsthès vocale ! --Serged/ 18 février 2008 à 14:22 (CET)
  14. non, pas de travail en plus. –MaCRoEco [oui ?] 20 février 2008 à 20:49 (CET)
  15. Même réflexion que MaCRoEco, rédiger des articles demande déjà assez de boulot comme cela. Antonov14 (d) 22 février 2008 à 08:42 (CET)
  16. Je suis plus pour une adaptation de la sythèse vocale à l'article, que le contraire. NicoRay (d) 24 février 2008 à 17:03 (CET)
  17. Non, du même avis que certains. L'audio est un plus, mais il doit s'adapter au projet existant. C'est la synthèse qu'il faut améliorer.Bashar [discuter] 24 février 2008 à 19:35 (CET)
  18. Je ne vois pas l'intérêt (qui d'ailleurs n'a pas été démontré dans le préambule) puisque la version audio « fige » l'article à une date donnée et dans un état donné. Qui va s'amuser à mettre à jour au même rythme qu'évoluent les articles ?... C'est un travail inutile. huster [m'écrire] 24 février 2008 à 23:05 (CET)
  19. Pas de version séparée. Comme précisé sur Projet:Articles audio (projet d'enregistrement humain des articles), l'enregistrement est l'occasion de se rendre compte de tout ce qui « coince » dans l'article, et l'occasion de l'améliorer. Il est strictement inutile de créer un doublon ; c'est l'article lui-même qu'il faut améliorer. guillom 25 février 2008 à 09:13 (CET)
  20. Idem que mes deux voisins du dessus. --Schwarzer Stern (d) 25 février 2008 à 19:45 (CET)
  21. Perte de temps indéniable // Jivé (d) 25 février 2008 à 21:06 (CET)
  22. Bonjour, le fait de réaliser une version en plus, qui sera alors un travail supplémentaire, ne parlons alors pas des mises à jour. En cas de débat sur un contenu, les versions pourraient se télescoper, ... De plus Wikipedia n'est-il pas un travail de fourmi qui a pour but de réaliser un ensemble structuré ? Dans ce cas formater afin d'obtenir une synthèse, inaudible et insupportable la plupart du temps serai-t-il réellement préférable à une version humaine, réelle, ce sur quoi se repose wikipedia  ? L'outil est au service de l'utilisateur, jamais l'inverse. Il me semble plus intéressant de s'occuper de perfectionner la synthèse vocale afin qu'elle serve au lieu de surcharger les contributeurs. La correction orthographique ne nous amène pas à utiliser une syntaxe simple mais à faire autant attention tout en étant aidé pour faire une analogie. Ce n'est pas un service à rendre aux utilisateurs qui sont demandeurs ainsi qu'aux contributeurs. Tout cela sans animosité et désolé de la longueur de mon propos.--Jimmysolo (d) 28 février 2008 à 06:24 (CET)
  23. - Contre Je me range à l'opinion du "non". Tel que conçu, Wikipedia est accessible pour les navigateurs à synthèse vocale, je le sais puisque j'ai un ami aveugle qui navigue sur le net avec une synthèse vocale qui s'appelle Jaws bien connue de tous les déficients visuels (http://defi-visu.comcga29.infini.fr/spip.php?article6). Donc laissons les choses en l'état, inutile de les compliquer. Si quelques difficultés d'accessibilité existent, c'est aux communautés concernées d'adapter les produits, on en a un très bon exemple avec les widgets pour Mac OS X permettant un accès direct aux contenus Wikipedia. Il me faut d'ailleurs souligner que la notoriété mondiale de WP devrait justement renverser les obligations. La mission de WP est de proposer du contenu et d'autres communautés peuvent parfaitement traiter ce contenu pour le rendre accessible dans toute circonstance. --Sonusfaber (d) 1 mars 2008 à 09:30 (CET)
  24. - ContreIdem : wikipédia est d'abord là pour l'information.--Christophe94 (d) 1 mars 2008 à 18:04 (CET)

[modifier] Neutre

  1. N'est-il pas plutôt intéressant d'adapter le logiciel de synthèse, car effectivement, c'est énervant quand il lit des données parasites mais avoir plusieurs versions va être compliqué à gérer. ThrillSeeker {-_-} 17 février 2008 à 11:30 (CET)
  2. Plutôt qu'un vote, le mieux serait de suivre l'avis de personnes compétentes, comme on le fait en matière de développement logiciel ou d'administration système. GL (d) 17 février 2008 à 12:16 (CET)
  3. Je ne sais pas si c'est vraiment opportun. Pour les voyants : clairement non, pour les malvoyants : je ne suis pas sur. Il faudrait avant tout l'avis des malvoyants. VIGNERON * discut. 2 mars 2008 à 08:45 (CET)

[modifier] Est-il opportun de proposer des fichiers audio créés par synthèse vocale ?

Ici, on proposerait directement des versions audio hébergées sur commons sur le principe des lectures du Projet:articles audio grâce à un modèle, ils seraient créés a partir d'une version de l'article préalablement mise en forme pour être compatible avec la synthèse vocale.

[modifier] Oui

  1. PoppyYou're welcome 17 février 2008 à 01:31 (CET), mais à la restriction de la question précédente. Pas de version optimisée hébergée ici, pas de modification du format des articles.
  2. Oui, car cela peut-être utile à un large public voyant et non voyant, analphabète ou non. En plus s'est simple et très rapide, il suffit de faire un clic en haut à droite de l'écran. Il serait utile d'insérer un lien pour le streaming ou téléchargement à côté du lien de l'article dans catégorie:article audio en synthèse vocale. Pour l'actualisation : idem ci-dessus. Les robots peuvent nous être utile. Il ne faut pas que l'article audio soient une ébauche Afin que l'actualisation ne soient pas trop fréquente et en plus cela risque de n'apporter aucune connaissance à l'auditeur. Il faudrait aussi, que les anciennes versions des fichiers audio soient supprimer sur Commons car cela les informations sont déjà sauvegarder en texte ce qui est suffisant. Je suis pour car cela rejoint le projet:articles audio à part que cela nécessite du travail pour avoir une qualité équivalente à ce projet. De plus les fichiers proposés sont en Ogg Vorbis d'une qualité audible similaire au wave. Et l'avantage de ce format sonore c'est qu'il est libre de droit et convertible facilement en toutes autres formats. Vi..Cult... (discuter) 17 février 2008 à 08:31 (CET)
  3. Les connaissances pour tout le monde - Shaddam 5 17 février 2008 à 10:49 (CET)
  4. Faute de mieux (lecture humaine) et sur les AdQ uniquements. ThrillSeeker {-_-} 17 février 2008 à 11:30 (CET)
  5. Pourquoi se priver d'une fonctionnalité qui facilite l'accès à certains (personnes âgées, analphabètes...) ou pour utiliser différemment les articles (en voiture...). Peut également constituer une aide à la relecture : un mot avait été oublié dans Léonard de Vinci et personne ne l'avait relevé parmi les relecteurs. A mon avis à réserver aux articles déjà aboutis : AdQ, BA et quelques articles déjà bien avancés et stabilisés. --Yelkrokoyade (d) 17 février 2008 à 15:04 (CET)
  6. Oui Oui --GarfieldairlinesCause-moi 18 février 2008 à 11:08 (CET)
  7. + Pour Pourquoi ne pas revenir à la lecture humaine ?--Christophe94 (d) 1 mars 2008 à 18:06 (CET)

[modifier] Non

  1. Non, c'est au client de choisir son navigateur. En fonction du handicap, le navigateur peut être vocal, braille, etc. Si les pages générées par le logiciel respectent les standards d'accessibilité, alors on est certains qu'un maximum de lecteurs pourront y avoir accès. Ce n'est pas à nous de nous substituer à des logiciels spécialisés. Outre le problème de la bande passante, il y a celui de l'actualisation des articles : avec des versions "orales" en cache, le lecteur ne peut pas avoir accès aux dernières versions, ni modifier les articles. Arnaudus (d) 17 février 2008 à 00:10 (CET)
  2. Je ne pense pas que la fondation ai les finances nécessaire pour héberger des dizaines de millions (en constante augmentation) de fichiers audio, à multiplier régulièrement par chaque nouvelle révision des articles (toutes les versions d'un fichier étant sauvegardées). Okki (discuter) 17 février 2008 à 01:43 (CET)
  3. gadget (un malentendu fréquent à dissiper: l'impact est nul pour l'accessibilité, et par ailleurs existence de services en ligne ou client permettant aux visiteurs qui le souhaitent de produire eux-mêmes une version audio), lourd à gérer (actualisation notamment) pour un résultat médiocre (version dégradée du contenu, format ogg vorbis confidentiel). --Lgd (d) 17 février 2008 à 08:03 (CET)
    La disparition des formules mathématiques rend les passages concernés incompréhensibles (Tsunami, Microscopie électronique à balayage, Arithmétique modulaire). Les changements de langue ne sont pas pris en compte (début de Microscopie électronique à balayage). Des nombres ne sont pas compréhensibles (1 500 lu « un cinq cent »). C'est également le cas de diverses unités et fréquemment des siècles en chiffres romains. Les titres de tableau sont lus, mais pas les tableaux (qui seraient incompréhensibles de toute façon)... --Lgd (d) 21 février 2008 à 05:59 (CET)
  4. Plutôt non, tant que les autres possibilités n'ont pas été étudiées, ainsi que les conséquences sur la performance du projet. TigHervé (d) 17 février 2008 à 08:54 (CET)
  5. idem Lgd --Ofol (moi . ) 17 février 2008 à 11:11 (CET)
  6. plutôt non. Les articles sont inaudibles à cause de la monotonie du robot. A rediscuter quand la technique se sera améliorer. Les personnes qui auraient besoin de synthétiser les articles peuvent le faire lorsqu'ils le souhaitent --Pok148 (d) 17 février 2008 à 11:29 (CET)
  7. Idem Lgd. GL (d) 17 février 2008 à 12:16 (CET)
  8. Proposer une lecture d'écran est une bonne idée ; stocker les fichiers ne présente aucun intérêt. Essayez plutôt de fournir un lien dynamique vers un système de traduction (éventuellement équipé d'un système de cache qui fera un stockage de bien meilleure façon que quelques contributeurs téléchargeant des nouvelles versions à la main). — Jérôme 17 février 2008 à 17:47 (CET)
  9. Problème de bande passante à ne pas négliger (certains d'entre nous peuvent ne pas connaitre le cout énorme que cela représente). Le choix du format peut poser problème et l'automatisation du passage en synthèse vocale est difficile. Manu1400 (d) 17 février 2008 à 18:00 (CET)
  10. Idem Jérôme Ugo14 (d) 17 février 2008 à 18:28 (CET)
  11. Comme ça a déjà été dit, c'est le boulot de logiciels spécifiques qui sont étudiés pour la synthèse vocale d'une page web, donc qui fonctionnent certainement mieux que tout ce que pourra faire WP dans ce domaine, et en plus ça évite de donner une version périmée (puisque fixe) à un auditeur. La seule chose à faire est de veiller à la plus grande accessibilité possible de WP pour ce genre de logiciels notamment.--Cattzy (d) 18 février 2008 à 00:07 (CET)
  12. Idem LGD. Il y a plus important/urgent à faire sur Wikipédia ;) JSDX (d) 18 février 2008 à 13:33 (CET)
  13. Il existe des logiciels de synthèse vocale, assez au point. En passant, stigmatisons l'attitude de Microsoft qui fournit un système de synthèse vocale dans Windows (XP et Vista), uniquement en anglais dans les versions françaises ! (alors qu'ils ont développé la version française depuis longtemps, téléchargeable, mais bien planquée sur leur site !) --Serged/ 18 février 2008 à 14:29 (CET)
  14. idem JSDX –MaCRoEco [oui ?] 20 février 2008 à 20:49 (CET)
  15. Les précédents contributeurs ont soulevé tous les problèmes qui me font voter non. Antonov14 (d) 22 février 2008 à 08:46 (CET)
  16. Suite à mon vote négatif précédent. Par contre une version Wiki en braille me paraît plus constructive. huster [m'écrire] 24 février 2008 à 23:08 (CET)
  17. Non. On peut soit proposer une version enregistrée par un humain (voir Projet:Articles audio) et dans ce cas, il y a une réelle plus-value par rapport aux logiciels de synthèse vocale, soit ne rien proposer du tout et la synthèse vocale est faite directement côté visiteur : les personnes ayant des problèmes d'accessibilité possèdent déjà les outils logiciels nécessaires, et ainsi ils ont accès à la version la plus à jour. guillom 25 février 2008 à 09:13 (CET)
  18. Les visiteurs concernés ont en effet pour la plupart sûrement tous les outils nécessaires à disposition (De plus, choisir les articles à synthétiser parmi ceux "de qualité" réduit certes en théorie le nombre de mises à jour nécessaires, mais je ne suis pas sûr que l'article "alimentation en Grèce antique" est le sujet d'intérêt de beaucoup des intéressés, par rapport aux articles les plus visités de Wikipédia (sélection pas très logique en fin de compte). Enfin je ne suis pas sûr d'avoir été clair, mais bon, fin de parenthèses. --Schwarzer Stern (d) 25 février 2008 à 19:53 (CET)
  19. - Contre Il ya malheureusement/heureusement d'autres trucs plus importants à faire // Jivé (d) 25 février 2008 à 21:07 (CET)
  20. - Contre tel que conçu, wikipedia est accessible pour les navigateurs à synthèse vocale, je le sais puisque j'ai un ami aveugle qui navigue sur le net avec une synthèse vocale qui s'appelle Jaws (http://defi-visu.comcga29.infini.fr/spip.php?article6). Donc laissons les choses en l'état. Si quelques difficultés d'accessibilité existent, c'est aux communautés concernées d'adapter les produits, on en a un très bon exemple avec les widgets pour Mac OS X permettant un accès direct au contenu Wikipedia. --Sonusfaber (d) 1 mars 2008 à 09:27 (CET)

[modifier] Neutre

  1. Comme service externe non hébergé par wikimedia à la limite. (à ce sujet je n'ai trouvé que des logiciels mal foutus et/ou payants sur internet, il n'existe pas de lecteur d'écran libre et gratuit ?) Tavernier (d) 17 février 2008 à 00:20 (CET)
  2. Comme l'indique Lgd, c'est un gadget. Je ne suis pas contre car cela ne dégrade pas la qualité du rendu des articles, mais pas pour non plus non plus car comme c'est un gadget, il faut voir si les compétences mobilisées pour produire ces fichiers ne seraient pas mieux utilisées ailleurs et pour cela avoir une idée de la population qui serait intéressée. S'il faut mobiliser trois bénévoles sur Commons et Wikipédia, pour produire chaque semaine une poignée d'articles qu'une dizaine de personnes dans le monde consulteront en un an, cela ne vaut par exemple pas le coup... GillesC →m'écrire 17 février 2008 à 12:28 (CET)
  3. Assez surpris par l'intonation et la fluidité de la voix, plutôt agréable. Mais des petites erreur sur les renvois ref et les chiffres qui ne doivent pas être très compréhensible quand on a pas le texte sous les yeux. Noritaka666 (d) 17 février 2008 à 17:40 (CET)
  4. Je suis partagé. Certes on y a l'accessibilité, mais les mots étrangers au français (comme les noms de films, les noms d'albums, les noms de personnes) ne sont pas bien prononcés, et il reste toujours le problème de mise à jour. Certaines pages changent très très vite. C'est pourquoi je décide de laisser le reste de la communauté en décider. Zouavman Le Zouave 26 février 2008 à 13:42 (CET)
  5. Idem que précédent. Je ne sais pas si c'est vraiment opportun. Pour les voyants : clairement non, pour les malvoyants : je ne suis pas sur. Il faudrait avant tout l'avis des malvoyants. VIGNERON * discut. 2 mars 2008 à 08:45 (CET)

[modifier] Qui serait prêt à participer à la mise en place du projet article audio en voix de synthèse ?

Inscrivez votre pseudo ci-dessous si la mise en place d'un tel projet vous intéresse

  1. Je suis partant pour participer à ce projet, ci celui-ci est efficace et pas trop prenant en temps. Vi..Cult... (discuter) 17 février 2008 à 08:45 (CET). Je souhaite que les problèmes soulevés apporterons une amélioration des articles en voix de synthèse. J'écoute les conseils des Wikipédiens, donc je renonce à mettre en place avant mi-mars 2008 les 800 articles de qualité en audio. Car il existe des problèmes à résoudre et de plus cela me prend 6 minutes par articles en moyenne soit 8 fois plus rapide que de le faire par voix humaine. (cela me prend trop de temps). La solution c'est que ceux soit fait automatiquement. Il suffit de cliquer en haut à droite de la page pour lancer soit le téléchargement ou le streaming. Vi..Cult... (discuter) 23 février 2008 à 10:19 (CET)