Wikipédia:Télécharger la base de données

Un article de Wikipédia, l'encyclopédie libre.

À propos de Wikipédia < Publications < Télécharger la base de données

Wikipédia offre des exemplaires gratuits de son contenu, en fonction des intérêts des utilisateurs. Ces bases de données peuvent être utilisées pour effectuer un site miroir, une utilisation personnelle, des sauvegardes informelles, des requêtes ou une base de données. Tout le texte contenu est sous la licence de documentation libre GNU (GFDL). Les images et autres fichiers médias sont disponibles sous des termes différents, tel indiqué sur leurs pages de description[1]. Pour des conseils sur notre respect de ces licences, voir Wikipédia:Droit d'auteur.

Des sites externes proposent aussi le téléchargement du seul contenu des article, destiné à être utilisé directement hors ligne.

Sommaire

[modifier] Où la trouver ?

  • Sauvegarde de tout projet de la Fondation Wikimedia : http://download.wikimedia.org/
  • Wikipedia en français dans le format SQL et XML : http://download.wikimedia.org/frwiki/
    • pages-articles.xml.bz2 - révisions courantes, sans les autres espaces de noms. (c'est probablement celle que vous voudrez)
    • pages-current.xml.bz2- révisions courantes, toutes les pages.
    • pages-full.xml.bz2/7z - révisions courantes, toutes les pages, (y compris les pages d'utilisateur et de discussion)
    • pages-meta-history.xml.bz2 - toutes les révisions, toutes les pages.
    • abstract.xml.gz - page résumés.
    • all_titles_in_ns0.gz - les titres des article uniquement.
    • fichiers SQL pour les pages et les liens sont également disponibles
    • Attention : Certaines sauvegardes sont peut-être incomplètes - portez attention aux mises en garde de type « Dump complete, 1 item failed » près du fichier.
  • Pour télécharger un sous-ensemble de la base de données au format XML, comme une catégorie spécifique ou une liste d'articles, voir Special:Exporter, dont l'utilisation est décrite à Aide:Export.
  • Télécharger le logiciel Wiki : MediaWiki.
  • Base de données du logiciel : MySQL.
  • Téléchargement des images : Voir ci-dessous.

[modifier] Images et médias téléchargés en amont

Contrairement à la plupart des articles en texte, les images ne sont pas nécessairement sous licence GFDL. Elles sont peut-être aussi sous l'une des nombreuses licences libres, dans le domaine public, considérées comme usage loyal (fair use), ou encore sous droit d'auteur (qui devrait être supprimées). L'utilisation de l'usage loyal des images en particulier en dehors du contexte de Wikipedia ou des ouvrages semblables peut être illégale. Les images sous la plupart des licences requièrent un crédit, une paternité et éventuellement d'autres informations sur le sur le droit d'auteur jointes aux fichiers. Ces informations sont incluses dans les pages description des images, qui font partie du texte de sauvegarde disponible à download.wikimedia.org. En conclusion, télécharger ces images est à vos propres risques (juridique).

[modifier] Voir aussi

[modifier] Articles connexes

[modifier] Liens externes

  • Moulinwiki propose en téléchargement tout le contenu de Wikipédia en français (et quelques autres langues) sans les images, en "prêt à graver" sur CD pour consultation hors ligne.
  • (en) Wikipedia Offline est une application commerciale contenant 2 600 000 articles avec un logiciel d'aide pour la recherche hors-ligne et l'affichage de contenu de Wikipédia.

[modifier] Notes

  1. À propos des licences pour un complément d'information sur Commons.