Discussion Projet:Catégories/Méthodes de catégorisation

Un article de Wikipédia, l'encyclopédie libre.

Sommaire

[modifier] Relation catégorie-catégorie

J'ai du mal à saisir la relation catégorie-catégorie, en particulier le cas où l'on peut mettre une catégoriser une catégorie. L'exemple donné me laisse perplexe. Je ne comprends pas pourquoi [[Histoire de la Corse]] aurait plus sa place en tant dans la sous-catégorie de [[Catégorie:Région française]] que de celle de [[Catégorie:Île]]. L'histoire de la Corse n'est pas une région française... Helldjinn 1 avril 2006 à 13:07 (CEST)

L'histoire de la Corse va plus simplement dans les départements de la France, car à l'instant oçù nous parlons, la Corse est un département français et que toutes les histoires des autres départements français se situent dans [[:Catégorie:Région française]] même si celles-ci ont été romaines, celtes, franches, germanes, espagnoles, normandes, saxones, anglaises, italiennes, arabes, ... pendant un laps de temps plus ou moins long. Mais l'article Corse se retrouve catégorisé non seulement sous Catégorie:Île, mais aussi sous [[:Catégorie:Corse]]/[[:Catégorie:Département français]]/[[:Catégorie:Région française]]/[[:Catégorie:France]]/[[:Catégorie:Géographie]] (du plus spécifique au plus général) et autres si on inclue de l'histoire, les spécialités régionales, les tenants et aboutissants économiques, les diverse politiques, ...
Et pour l'instant, on attaque pas encore les paradoxes spaciaux temporels, ça va encore. :D --Lolo le 13 1 avril 2006 à 14:46 (CEST)
Je comprends ta perplexité, qui s'explique par le flou régnant sur la définition des articles entrant dans chaque catégorie. Il ne faut pas perdre de vue cette définition  : les catégories relatives aux régions françaises regroupent tous les articles concernant ces régions, dont leur histoire, tandis que la catégorie îles regroupe seulement des îles, me semble-t-il , mais j'admet qu'on pourrait aussi décider que la catégorie régions française ne regroupe que les 25 articles sur ces régions. Spedona 3 avril 2006 à 23:22 (CEST)
C'est sûr qu'on peut considérer les régions françaises comme des entités historico-politico-(...)-géographique, contrairement à une île qui est un concept purement géographique. Là, ça va. Je pense qu'on est cependant tous d'accord pour que chaque catégorie contienne un petit descriptif des articles que la catégorie est amenée à recevoir. Helldjinn 4 avril 2006 à 09:59 (CEST)
Je trouve aussi, qu'un déscriptif est important, et déjà possible. Mais pour l'instant peu de contributeurs s'en servent. Traumrune 4 avril 2006 à 19:45 (CEST)
Problème du même ordre dans les sous catégories de Catégorie:Enseignement supérieur : la Catégorie:Institut d'études politiques inclut unesous-Catégorie:Ancien élève de Sciences Po. Ce qui fait qu'on y récupère des pesonnalités comme Fanny Ardant ou Christine Okrent qui n'ont rien à voir avec l'enseignement. Mica 14 mai 2006 à 15:59 (CEST)

[modifier] Nombre d'entrées dans une catégorie

Bonjour. Dans certaines catégories, surtout celles concernant des personnalités françaises, il y a des centaines de noms et je me demande s'il n'y a pas une possibilité de sous-catégories. Mais cela devrait être assez simple pour que les auteurs des articles puissent le faire. Actuellement, on troue énormement de nom dans Projet:Articles sans catégories. Eventuellement quelque chose au niveau des ébauches personnalité. (Mais à ce niceau, je ne connais rien).Traumrune 3 avril 2006 à 23:07 (CEST)

C'est un autre débat qui mériterait une page ad-hoc. Mon avis c'est qu'il faut trouver un compromis et peut-être éviter de trop morceler les catégories. Spedona 4 avril 2006 à 20:21 (CEST)

[modifier] Contre-proposition

[modifier] A quoi sert une catégorie?

Une catégorie c'est simple: c'est une page qui apparaît quand on navigue dans wiki à travers les liens "catégories". On s'en sert en principe pour chercher de l'information (ou de l'inspiration).

Ca permet de trouver un thème (rarement hélas) par recherche descendante (du général au particulier), ou (plus probablement) quand on tombe sur un thème intéressant, de circuler non seulement à travers les liens horizontaux, mais en remontant à la catégorie pour faire un panoramique automatique sans dépendre de la manière dont le rédacteur a sélectionné ses liens.

Effectivement, "voyage au bout de la nuit" est utilement rattaché à une catégorie "céline", qui me permet de trouver d'autres informations sur un thème qui m'a intéressé; mais pas uniquement "Céline": ce voyage comporte de nombreux autres aspects.

Sinon, ça ne sert à rien d'autre, non?...

Dommage, ça ne marche pas. J'ai essayé de trouver un article sur les idéogrammes chinois (une de mes marottes) en passant par les catégories ... essayez pour voir, c'est édifiant. En trois clics, on ne sait plus où on est.

Conclusion: le système est à revoir. Si le seul intérêt c'est le plaisir intellectuel d'une poignée de participants, c'est cher payé.

[modifier] Même catégorie = Même thème ou sujet

Ce que je veux trouver dans une page "catégorie", c'est typiquement:

  • Les articles traitant du même thème général que ce que j'ai lu (contenu de la catégorie);
  • La liste des thèmes connexes: plus spécialisés, voisins, plus général,... (lien entre catégories).

Pour faire un travail utile de ce point de vue, celui qui catégorise une catégorie doit théoriquement se poser comme question:

  • Quel est le sujet commun qui unit tous ces articles?
  • Quels sont les thèmes spécialisés associés?
  • Quels sont les thèmes généraux auxquels ce thème se raccroche?

... théoriquement, parce que pratiquement, on ne peut pas gérer les thèmes spécialisés à partir d'une catégorie (ce sont les filles qui engendrent les mères). Donc on ne travaille que sur les thèmes plus généraux, pour catégoriser une page préexistante. En revanche, on peut imaginer de pré-capturer des thèmes spécialisés par mots clefs (voir infra).

[modifier] Enchaînement des catégories : relation "voir aussi"

La question de la transitivité ou non des catégories est un faux problème: dans certains cas, le regroupement est tel que la catégorie est effectivement transitive (eg, les parties successives pays > région de pays > départements de région > etc). Pour d'autres usages, il n'y a aucune raison qu'il y ait une transitivité quelconque. Typiquement, si je créé une catégorie intermédiaire "monde chinois", j'aurai des sous-catégories géographiques, linguistiques, touristiques, ... qui sont simplement différents aspects du monde chinois, mais la relation "inclusion" ou la relation "est_un" est totalement hors sujet.

Raisonnons par l'absurde: tout se rattache finalement à la catégorie "racine", donc tout "est-une" racine ??? Tout ce qui aboutit à l'arborescence "loisir" est-un loisir ???

Un torrent est effectivement un sujet intéressant pour qui s'intéresse à la montagne, donc "torrent" doit apparaître dans une sous-catégorie de "montagne". Certes, mais ce n'est qu'une minuscule partie du travail, un torrent est également intéressant pour qui s'intérese à l'hydrogéologie, à l'érosion,...

[modifier] Catégorie: mal nommée

En fait, ce que j'attend d'une "catégorie" n'est pas du tout la même chose suivant que je suis sur un article ou sur une page de catégorie.

  • Dans un article: il faut qu'elle fonctionne comme un mot clef (et de préférence, qu'un article ait plusieurs mots clefs)
  • Dans une catégorie, il faut circuler non pas dans une arborescence, mais dans un treillis: une page a plusieurs parents, et un parent plusieurs enfants, de natures hétéroclites.

Par pitié, faites passer le mot, affichez les avertissement automatiques, pour que:

  • les auteurs d'articles mettent plusieurs mots clefs;
  • les catégorisateurs de catégories pensent à plusieurs rattachements;
  • ceux qui crééent une catégorie doivent essayer d'en retrouver le chemin depuis la racine (s'ils ont perdu, ils gagnent le droit de mettre de nouveaux chemins).

Les considérations sur l'inclusion, la transitivité,... relèvent de la sodomisation de diptères: si la catégorie ne sert pas à circuler, elle ne sert à rien ni à personne. Soyons pragmatiques, et ne cherchons pas de règles "logiques" là où il n'y a que de la "pratique".

Ce n'est que par la multiplicité que les voies d'exploration peuvent être exploitables via les catégories.

[modifier] Suggestions de robots

Pour les "hackers" locaux:

  • algorithme pour indexer chaque catégorie par son "niveau de profondeur" depuis la racine commune.
  • algorithme pour mettre en bannière d'un article l'arborescence la plus courte remontant vers la racine, avec des liens actifs à chaque étape (on aurait des surprises, à mon avis...).
  • récupérer non seulement les catégories "mères", mais également des "soeurs" pour circuler horizontalement.
  • Pré-indexer tous les articles contenant tel ou tel mot clef = doter les catégories d'une possibilité d'équation de recherche,
  • ... vous en voulez d'autres?

Michelet 13 avril 2006 à 21:28 (CEST)


[modifier] Relation de rapport

Autant la relation d'identité (est un) et la relation d'appartenance (est un élément de) aide à catégoriser un article, autant la relation de rapport, à mon sens, apporte de la confusion. Prenons l'exemple du roman Voyage au bout de la nuit : on le met dans la Catégorie:Louis-Ferdinand Céline (puisque le rapport est évident), on va sans doute mettre aussi dans cette catégorie, l'article Louis-Ferdinand Céline. Et puis, imaginons un nouvel article traitant d'une anecdote historique concernant Céline et une autre personne célèbre. Le rédacteur s'empressera de mettre son article dans Catégorie:Louis-Ferdinand Céline. Céline est un écrivain français donc la Catégorie:Louis-Ferdinand Céline va devenir une sous catégorie de Catégorie:Écrivain français. Et là, on ne respecte plus la règle : "Il faut que chaque élément contenu dans la catégorie-fille puisse être catégorisable dans la catégorie-mère."

A mon sens, la relation de rapport s'effectue par le lien interne et non par la catégorie.

J'ai un autre cas "d'espèce" avec 2 catégories : Metteur en scène et Métier du théâtre. Si je mets la catégorie Metteur en scène dans la catégorie Métier du théâtre, ça ne fonctionne pas puisque je vais avoir des articles sur des personnes dans une catégorie qui concerne des métiers. Donc, à mon sens, je ne dois mettre que l'article principal Metteur en scène dans la catégorie Métier du théâtre pour que l'arborescence fonctionne. xila 6 mai 2006 à 19:28 (CEST)


[modifier] Méthode pour faire avancer la réflexion

J'ai remarqué que Wikipédia offre de multiples possibilités de liens. On pourrait donc lister d'une part toutes les relations entre articles et entre catégories :

  • relations d'identité
  • relations de rapport (préciser les différents cas)
  • ... etc

et d'autre part ce qu'offre Wikipédia :

  • les liens internes simples
  • les liens internes des articles connexes (partie "voir aussi")
  • les catégories
  • les entêtes de catégories ou on met les catégories connexes
  • ... etc

puis discuter sur les règles à établir : pour exprimer tel type de relation, à priori privilégier tel type de liens.

Par ailleurs, je pense qu'il y a une vraie attente pour des règles sur l'organisation d'arborescence de portail ou de projet. Xila 16 mai 2006 à 12:00 (CEST)

C'est une très bonne idée de rationalisation, j'essaiera de donner un avis un peu plus constructif rapidement. Boeb'is 21 mai 2006 à 12:59 (CEST)
Les pistes avancées sont tout à fait interessantes, mais j'ai du mal à voir les perspectives concrètes.
Un des problèmes que j'avais trouvé en débatant/trollant sur les catégories était la question de savoir si on devait catégoriser en fonction de ce que l'article a apporté à la catégorie, ou sur ce que la catégorie a apporté au tout. Cela soulignait notamment la différence entre les catégories assez consensuelles, et celles qui se fondent sur des aspects secondaires.
Toute une partie des catégories se fondent sur un rapprochement entre articles qui ne pourrait pas se faire par les liens internes, et sont pour moi assez peu pertinent. Elles se bornent à faire des rapprochements bruts, à faire des liens type base de donnée sans tenir compte de la navigation.
Exemple: les catégories femmes, années de naissance ou de mort, religion, établissement soclaire passé... Ce sont des catégories qui n'ont plus du tout le sens de "voir aussi". Boeb'is 26 mai 2006 à 14:34 (CEST)
Je pense que tes questions sont au coeur du débat : Qu'est-ce qu'une catégorie ? Dans Aide:Catégorie, on donne cette définition : "les catégories doivent être considérées comme des contenants — des boîtes de rangement, en quelque sorte" et on précise : "les différents articles de Wikipédia constituent le véritable contenu encyclopédique". Pour complèter cette définition, on peut se poser cette question : à quoi sert une catégorie ?
Réponse : C'est un contenant qui sert à ranger, à mettre ensemble du contenu, pour le rendre plus lisible, plus accessible en l'ordonnant. Et c'est cette volonté de rendre lisible le contenu qui devrait, à mon sens, permettre de résoudre de façon pragmatique, les cas qui apportent plus de confusion que de clarté. Car il y a d'autres moyens qui rendent le contenu plus lisible. Se restreindre à n'utiliser que le moyen le plus pertinent permet à tous les moyens de garder leur rôle et donc de rester efficace (enfin bon, c'set général ce que je dis là, c'est plus une volonté de rationaliser).
Prenons l'exemple des personnes, anciens élèves d'une grande école. Une liste rendra bien plus lisible le contenu existant qu'une catégorie. On saura qui a fait cette école, quand ils l'ont faite, ce qu'ils sont actuellement ou ce qu'ils ont été.
C'est une tâche complexe mais passionnante : il faudrait définir les rôles des différents moyens mis à disposition par wikipédia.
Xila 27 mai 2006 à 13:47 (CEST)
Vos idées sont tout à fait pertinantes. Mais il me semble que beaucoup de créateurs d'articles ont tout simplement du mal à mettre leur article dans une catégorie appropriée. Il m'est arrivée de demander à des contributeurs de préciser leur article et de mettre une catégorie. Ils ont ajoutés les informations et m'ont laissé le soin de trouver la catégorie. Càd, ici on mène une discussion pour initiés, qui passe au-dessus de la tête d'un bon nombre. Mais je ne crois pas que s'est genant. J'aimme assez ajouter les catégories et il est urgent de les précisier Traumrune 27 mai 2006 à 23:22 (CEST)
Exact, il est nécessaire de rédiger des recommandations (peut-être à inclure dans l'aide). Voici ce que j'ai proposé dans Discussion Projet:Théâtre/Catégories, comme recommandations pour les catégories :
  1. Dans l'entête de la catégorie, définir quels sont les articles attendus (Proposition de Utilisateur:Helldjinn dans la section 1 de cette discussion)
  2. Toujours dans l'entête de la catégorie, indiquer quelles sont les catégories connexes (ou voisines) => rend plus lisible les arborescences en les allègeant, tout en offrant une naviguation large.
  3. Choisir le titre de la catégorie en fonction des articles attendus. exemple : il y a 175 articles sur des pièces de théâtre d'Eugène Labiche, donc une catégorie s'impose. Il me semble préférable de donner comme titre Pièce de théâtre d'Eugène Labiche que Eugène Labiche.
  4. S'interroger avant de mettre une catégorie dans une autre catégorie : Faut il mettre l'article qui traite du sujet ou bien la catégorie ? Est-ce que tous les articles de cette catégorie correspondent à la sur-catégorie ? => exemple : ne mettre que l'article principal Metteur en scène dans la catégorie Métier du théâtre, plutôt que de mettre la catégorie Metteur en scène dans la catégorie Métier du théâtre, autrement confusion : articles sur des personnes dans une catégorie qui concerne des métiers.

Xila 29 mai 2006 à 13:31 (CEST)

[modifier] 38 000 catégories, certaines quasi vides, et quand on veut catégoriser on s'y perd un peu

Bonjour à tous. Nouveau sous wikipédia, je veux trouver dans quelles catégorie mettre mes articles, et je tombe sur une liste fabriquée par un robot de ... 38000 catégories, qu'on ne peut consulter que 500 à la fois, en commençant par 10 pages de numéros et dates ... pas hyper simple. En plus je voulais mettre ici un lien vers cette page, mais je ne la retrouve plus... Alors je me dis plusieurs choses :

  • si on regroupait ces catégories dans de grandes pages permettant de trouver facilement les catégories adhoc ?
  • si on mettait un système pour qu'une catégorie ne commence vraiment à apparaître comme sérieuse que quand elle a au moins 3 articles (ça supprimerait beaucoup de catégories quasi vides). On pourrait faire une exception pour les catégories systématiques (ex fictif : album de rock de 1973 même sans article dedans pourrait rester si les album de rock de 1972 ou de 1971 ou de 1974 ... en contiennent pas mal, histoire de ne pas casser la série).
  • si on créait une liste des nouvelles catégories créées, qui attendraient une validation pour entrer dans la structure générale (histoire qu'on n'ait pas à repasser les 38 OOO en revue pour toute mise à jour des tables, histoire aussi de trouver des candidats à étoffer les catégories encore trop peu remplies pour être promues).
  • si on mettait une page Catégorie, histoire que quand on recherche catégorie dans "rechercher" on tombe sur quelque chose qui guide ?

Ces questions sont-elles idiotes ? Peut-être qu'existe déjà tout ou partie de ce que je raconte, mais que simplement je ne connais pas. Merci de m'éclairer alors. Je suis pret alors à me mettre au travail sur ces points. Cordialement, et wikiment vôtre, lafud.

Bonsoir. Le plus simple est de cliquer dans la page d'accueil sur "Table des catégories" sur cette page tu peux choisir la lettre de l'alphabet que tu veux, puis préciser. Tu sais sûrement si ton article parle de littératuer, de sport ou de chimie, etc. Un autre truc (que j'utilise souvent) regarder dans un article d'une thématique proche, comment il a été catégorisé. Bonne chance. Traumrune 8 juillet 2006 à 23:10 (CEST)

[modifier] Thèmes ou catégories ?

Bonjour, Ignorant l'existence de cette page j'ai entamé un débat sur le thème des catégories sur le bistro. Peps 2 août 2006 à 22:02 (CEST)