Aide:Recherche

Un article de Wikipédia, l'encyclopédie libre.

Cette page en bref : comment faire une recherche
  • Allez sur Special:Search ou utilisez la boîte de recherche à gauche.
  • Essayez la « recherche interne » ; si elle ne marche pas correctement, utilisez un moteur externe (Google, Wikiwix...)
  • Évitez les mots courants (« pourquoi », « de », « quand », etc.), préférez les mot-clés précis.
  • Les articles récemment créés peuvent ne pas apparaître avant un jour ou deux.
Vous consultez une page d'aide à la consultation de Wikipédia
Consultation
Recherche
Interface
Historique d'un article


Sommaire

[modifier] Introduction

La boîte de recherche à gauche.
La boîte de recherche à gauche.

Cette page explique comment rechercher une page sur Wikipédia. Pour trouver une page, vous pouvez utiliser les méthodes suivantes :

  • Naviguer de page en page en utilisant les liens et les catégories.
  • Entrer le nom désiré dans la boîte de recherche à gauche, et cliquer sur « Consulter » : vous arrivez directement sur la page avec ce nom, si elle existe. Voir Aide:Consultation pour les détails.
  • Entrer le nom désiré dans la boîte de recherche à gauche, et cliquer sur « Rechercher » : une recherche est lancée, les résultats montrent les pages s'approchant le plus de votre recherche. Cette page décrit comment utiliser la recherche au mieux.

Différents outils existent pour effectuer une recherche : le moteur de recherche interne de Wikipédia (la « recherche interne »), les moteurs de recherche externes (comme Google, Yahoo, MSN ou Exalead), et les outils de recherche spécialisés (comme Wikiwix). Chaque outil a ses avantages et ses inconvénients. Notez que Wikipédia n'est pas liée à ces compagnies.

[modifier] Quel outil de recherche choisir ?

Les options disponibles sur la page de recherche : la boîte déroulante sélectionne le moteur de recherche (par défaut, la recherche interne).
Les options disponibles sur la page de recherche : la boîte déroulante sélectionne le moteur de recherche (par défaut, la recherche interne).

Par défaut, les recherches se font avec la recherche interne de Wikipédia. Celle-ci possède trois inconvénients principaux :

  1. Étant toujours en développement, elle donne parfois des résultats non pertinents ; elle ne propose pas de correction quand un mot est mal orthographié.
  2. Les accents sont ignorés, ce qui facilite la recherche mais empêche de trouver les fautes d'accentuation.
  3. La mise à jour de l'index a été récemment améliorée, mais les articles les plus récents (créés dans les deux derniers jours) peuvent ne pas apparaître dans les résultats.

Quand la recherche interne ne donne pas les résultats souhaités, utilisez un moteur externe. Ces moteurs n'apparaissent que si vous avez activé JavaScript dans votre navigateur. Voici une brève description des moteurs proposés par défaut, par ordre alphabétique :

  • Exalead est un moteur français, disposant d'une fonction spéciale pour Wikipédia. Il permet de prévisualiser les pages trouvées, il extrait les mots-clés et les catégories (visibles dans le cadre de droite), et permet des recherches avancées de façon intuitive.
  • Google est le moteur le plus utilisé actuellement ; il dispose d'une interface sobre et d'un système connu de tri des résultats (le PageRank).
  • Wikiwix est un moteur conçu spécialement pour Wikipédia par la société française Linterweb. Il permet de chercher facilement des images, dispose d'une fonction « Atlas » et peut extraire les mots-clés et les catégories / portails. Il serait le plus prompt pour la mise à jour de son index.
  • Windows Live est le moteur de recherche de Microsoft dont l'apparence et le fonctionnement sont similaires à Google.
  • Yahoo! est le principal concurrent de Google.

Si ces moteurs peuvent donner des résultats plus pertinents que la recherche interne, ils ont aussi leurs limites : leur index peut mettre plusieurs semaines avant d'être mis à jour ; leur algorithme de classement est rarement public ; et ils ne « lisent » pas la syntaxe wiki, uniquement le rendu final, contrairement au moteur interne qui analyse le code wiki et permet donc la recherche par catégories ou par espace de noms, prend en compte les redirections, etc.

Le moteur que vous avez utilisé en dernier sera retenu grâce à un Cookie : ainsi, quand vous vous rendez sur la page de recherche, vous n'avez plus qu'à cliquer sur « Rechercher » pour utiliser votre moteur favori.

Il existe encore d'autres possibilités : d'autres moteurs généralistes existent (voir Métamoteur) et des outils spéciaux pour Wikipédia existent aussi (voir l'encadré « Autres outils » en haut de la page de recherche). On trouve notamment Mayflower pour les images de Commons, Pagename search pour chercher des titres avec des expressions régulières, etc.

[modifier] Utiliser la recherche interne

La recherche interne va donner une liste de pages, où les termes recherchés apparaissent. Ils peuvent apparaître dans le titre de la page, dans le corps de la page, ou encore être le titre d'une redirection vers une autre page.

Par défaut, la recherche interne trouve les pages comprenant tous les mots cherchés. Si vous cherchez « machin truc », vous trouverez les pages contenant à la fois « machin » et « truc ». Pour trouver les pages contenant « machin », « truc » ou les deux termes ensemble, il faut chercher « machin OR truc ».

[modifier] Majuscules et minuscules, accents, nombres

La recherche interne ne différencie pas majuscules et minuscules : chercher « CANADA », « canada » ou « CaNAda » donnera les mêmes résultats. De même, la recherche ignore les lettres accentuées : chercher « Tōkyō », « Tokyo » ou même « Tôkÿŏ » donnera les mêmes résultats. Cette fonctionnalité permet de trouver plus facilement les articles utilisant des diacritiques, mais empêche de rechercher les fautes d'orthographe (ceci est actuellement à l'étude, en attendant utilisez un moteur externe).

La recherche interne effectue automatiquement certaines translittérations (notamment pour le serbe ou le umlaut allemand). Dans certaines langues, elle permet de trouver les formes dérivées de verbes et de noms ; cette fonctionnalité n'est pas encore activée en français. Il est possible de chercher des nombres, bien que rechercher un nombre avec moins de quatre chiffres risque ne pas donner de résultats très pertinents. Certains caractères spéciaux, et notamment les apostrophes, peuvent poser problème lors de la recherche : essayez de supprimer l'apostrophe ou de la remplacer par une espace.

[modifier] Choix des mots-clés

Certains termes courants sont ignorés, comme les mots « le », « la », « de », « et », etc. ; de manière générale, évitez d'utiliser des mots courants (« quand », « tout », « pourquoi », etc.) : le plus souvent, les résultats ne seront pas pertinents ou trop nombreux. Sur Wikipédia comme avec d'autres moteurs, il vaut mieux éviter les phrases (chercher « tarte aux pommes » plutôt que « comment faire une tarte aux pommes ») et privilégier les mots-clés précis.

Pour inclure tout de même un mot normalement ignoré, ajouter le signe « + » devant lui. Exemple : en cherchant « Charles X », le « X » risque d'être ignoré ; il vaut mieux rechercher « Charles +X » pour de meilleurs résultats. Il est aussi possible d'encadrer l'expression de guillemets droits : ainsi, la recherche porte sur l'expression exacte (dans ce cas, il faudrait rechercher « "Charles X" ».

[modifier] Opérateurs

Les opérateurs suivants sont utilisables : AND, OR, + et -.

  • AND cherche les pages où les deux termes sont présents, c'est le comportement par défaut : « travail AND enfants » ne trouvera que les pages contenant à la fois « travail » et « enfants », et donne le même résultat que « travail enfants »
  • OR cherche les pages où un des deux termes est présent, et les pages où les deux termes sont présents : « travail OR enfants » trouve les pages contenant « travail », celles contenant « enfants », et celles contenant les deux termes.
  • « + » force la recherche à prendre en compte un mot. Exemple : « Travail +Enfants » trouve les pages contenant obligatoirement « Enfants » et éventuellement « Travail ».
  • « - » permet d'ignorer un mot. Exemple : « Luther -King » cherche les pages contenant « Luther » mais ne contenant pas « King ».
  • Les guillemets droits recherchent une expression exacte : « "Martin Luther King" » trouvera les pages contenant les mots « Martin Luther King » ensemble (contrairement à l'opérateur AND, avec lequel les mots peuvent être à différents endroits de la page mais pas nécessairement accolés).

Il est possible de combiner ces opérateurs grâce aux parenthèses : « (Travail AND enfants) OR (Exploitation AND enfant) », par exemple.

Il est possible d'utiliser le joker « * » pour remplacer une chaîne quelconque, même si son utilité est limité par la lexémisation (voir plus bas). Les autres jokers ne sont pas autorisés (comme « ? » pour remplacer une lettre quelconque), ni les expressions rationnelles.

[modifier] Rechercher dans un espace de noms

Pour chercher une page dans un espace de noms donné, utiliser la syntaxe suivante :

  • Rechercher « Utilisateur:Truc » pour trouver toutes les pages contenant « Truc » dans l'espace « Utilisateur: ».
  • Pour chercher dans plusieurs espaces de noms, les séparer avec une virgule : rechercher « Utilisateur,Aide,Discuter:Machin » va trouver les pages contenant « Machin » dans les espaces Utilisateur:, Aide: et Discuter:.
  • On peut aussi utiliser les numéros des espaces de noms, entre crochets : rechercher « [1,2,4]:machin » va trouver les pages contenant « machin » dans les espaces Discuter: (1), Utilisateur: (2) et Wikipédia: (4).
  • On peut utiliser des raccourcis[1], comme « wp:machin » pour « Wikipédia:machin ».
  • Le préfixe « tous: » sert à rechercher dans tous les espaces de noms en même temps (on peut aussi utiliser « tout: » ou « all: »[2]). Exemple « tous:trucmuche »

Sans précision, la recherche porte sur les espaces de noms que vous avez défini dans vos préférences, onglet « Recherche ». Pour les utilisateurs non enregistrés, la recherche ne porte par défaut que sur les articles (espace 0). Vous pouvez aussi utiliser les cases à cocher en bas de page.

[modifier] Rechercher dans une catégorie

On peut limiter la recherche à une catégorie en utilisant le préfixe « incategory: »[3], suivi du nom exact de la catégorie. Par exemple, rechercher « Smith incategory:"Naissance en 1723" » trouvera les pages contenant « Smith » (dans le titre ou le contenu) et se trouvant dans la catégorie Naissance en 1723. Le nom exact de la catégorie doit être utilisé (le mieux étant de le copier-coller).

Avec les opérateurs, il est possible de croiser des catégories : « incategory:"Ministre français" AND incategory:"Décès en 2006" » trouve les ministres français morts en 2006, tandis que « incategory:"Bateau des années 1960" OR incategory:"Bateau des années 1970" » trouve les bateaux construits dans les années 1960 ou 1970.

D'autres outils peuvent être plus adaptés pour explorer les catégories, suivant vos besoins, comme intercat, pour croiser des catégories, ou les outils disponibles dans la « boîte à outils » visible sur chaque catégorie.

 Attention : "incategory" ne cherche pas dans les catégories insérées via un bandeau, comme par exemple les catégories d'ébauches[4].

[modifier] Fonctionnement détaillé de la recherche interne

Le moteur de recherche interne est Lucene Search 2.0. À intervalles réguliers, un « index » de la base de données est créé, et la recherche porte sur cet index. En créant l'index, certaines parties sont ignorées, d'autres sont converties (accents, majuscules, translittérations) ; les mots et les nombres sont séparés et indexés. Lors de la recherche, le moteur trouve les pages correspondant aux critères puis les trie en leur attribuant un « score ».

[modifier] Contenu ignoré

Lors de la construction de l'index pour la recherche, l'intégralité des titres et du contenu des pages est inclus, sauf :

  • Les noms de modèles (mais leurs paramètres sont inclus).
  • Les paramètres des images comme thumb ou 200px (mais la légende et le nom de l'image sont inclus).
  • Les URL des liens externes (utiliser Special:Linksearch pour les chercher).
  • Le code XML.
  • Les paramètres des tableaux

[modifier] Tri des résultats

Les pages sont triées selon plusieurs paramètres. En gros, une page obtient un score plus élevé et donc apparaît plus haut dans les résultats si :

  • son titre contient le mot recherché ;
  • le mot recherché est contenu plusieurs fois dans la page ;
  • la page a beaucoup de « liens entrants » depuis d'autres pages, avec le mot recherché.
    • si ces liens sont situés au début des pages, le score augmente encore.
  • elle est longue.
  • des redirections avec le mot recherché pointent vers cette page.

[modifier] Lexémisation

Les mots, lors de la construction de l'index, sont lexémisés, c'est-à-dire réduits à l'état de radicaux[5]. Ceci permet de rechercher les formes infléchies des verbes et des noms assez facilement, de même que les féminins et les pluriels. Exemple : chercher « aimé » cherchera également les formes « aimée », « aimés », etc., sauf si l'on précise que l'on veut le mot exact, en l'encadrant de guillemets. La forme recherchée a toutefois priorité dans les résultats.

[modifier] Redirections

Les redirections ne sont pas montrées dans les résultats ; leur destination, si elle est pertinente, est par contre affichée.

[modifier] La page existe, mais le moteur ne la trouve pas

Pour des raisons de performance, les changements très récents ne sont pas toujours pris en compte dans la recherche. À certains moments, le moteur de recherche peut utiliser un index qui n'est pas du tout mis à jour. Cette situation est temporaire.

[modifier] Recherche dans Wikipédia avec Google

Google met à jour ses index environ une fois par mois, la recherche est donc fondée sur le contenu de Wikipédia à ce moment ainsi que sur le texte affiché par un navigateur, et non sur le texte source tel qu'il apparaît dans la boîte d'édition. La recherche avec Google est plus rapide que celle de Wikipédia.

Après avoir trouvé un article vous pouvez choisir de voir la version actuelle sur Wikipédia ou la version plus ancienne utilisée par Google.

Si vous utilisez fréquemment Google pour effectuer des recherches, vous pouvez envisager d'installer la barre d'outils Google.

Mais la façon la plus complète de rechercher dans Wikipédia avec Google est d'utiliser la page [1]

[modifier] Notes

  1. Administrateurs : ils sont définis dans MediaWiki:Searchaliases.
  2. Administrateurs : cet alias est défini dans MediaWiki:Searchall. Mettre chaque alias sur une nouvelle ligne.
  3. Administrateurs : on peut définir des alias dans MediaWiki:Searchincategory, chaque alias sur une nouvelle ligne. Ne pas utiliser « catégorie », qui serait en conflit avec le préfixe pour cet espace de nom.
  4. Bug 10822
  5. L'algorithme détaillé se trouve sur cette page.

[modifier] Voir aussi