DBpedia

Un article de Wikipédia, l'encyclopédie libre.

DBpedia est un projet d'extraction de données de wikipédia pour en proposer une version web sémantique. Ce projet est mené par l'Université de Leipzig, l'Université libre de Berlin et l'entreprise OpenLink Software.

Sommaire

[modifier] Contenu du dataset

DBpedia est interconnecté avec GeoNames, MusicBrainz, CIA World Factbook, le projet Gutenberg, Eurostat entre autres[1].

La base de données décrit 2 180 000 entités, incluant au moins 80 000 personnes, 293 000 lieux, 62 000 albums de musique et 36 000 films et contient 489 000 liens vers des images, 2 700 000 liens vers des pages extérieures, 2 101 000 liens vers des datasets externes et 207 000 catégories Wikipédia[2].

Le contenu de la base est disponible sous licence GFDL (puisque le contenu est tiré de wikipédia).

[modifier] Technologies

Les informations étant stockées avec Resource Description Framework, on peut effectuer des requêtes sur la base de données via SPARQL.

Le moteur d'extraction de données est réalisé avec PHP 5[3], c'est un logiciel libre diffusé sous Licence publique générale GNU. Son code source est distribué : il est hébergé sur sourceforge et disponible via Subversion.

[modifier] Notes et références

  1. http://wiki.dbpedia.org/Interlinking
  2. http://wiki.dbpedia.org/Datasets
  3. http://wiki.dbpedia.org/Documentation

[modifier] Voir aussi

[modifier] Liens externes

Autres langues