Aide:Pywikipedia/replace.py

Un article de Wikipédia, l'encyclopédie libre.

Replace.py est un script en Python pour les bots Pywikipédia. Ce script permet d'effectuer des remplacements de texte. Lorsqu'il est lancé, il récupère les informations sur les pages à modifier à partir d'un dump XML, ou d'un fichier texte. Il peut également modifier une seule page.

Ce bot peut être lancé à l'aide des paramètres suivants :

-xml 
Récupère les informations à partir d'un dump XML local (pour les dumps, voir http://download.wikimedia.org/). L'argument est utilisé avec la syntaxe -xml:nomdefichier.
-file 
Travaille sur toutes les pages listées dans un fichier texte local. Le script interprètera chaque lien wiki (entre doubles crochets) pour modifier les articles. L'argument est utilisé avec la syntaxe -file:nomdefichier.
-cat 
Travaille sur toutes les pages qui appartiennent à la catégorie spécifiée. La syntaxe est -cat:nomcategorie.
-page 
Modifie uniquement la page spécifiée. La syntaxe est -page:nompage. Cet argument peut être employé plusieurs fois pour éditer un nombre multiple de pages.
-ref 
Travaille sur toutes les pages liées à la page spécifiée. La syntaxe est -ref:nompagereferee.
-start 
Travaille sur toutes les pages du wiki, en partant de la page donnée. Choisissez -start:! pour commencer depuis le tout début. Cette option est à éviter, excepté dans le cas où il n'existe aucun dump XML récent.
-regex 
Utilise des expressions rationnelles pour faire les remplacements. Si cet argument n'est pas donné, le bot fera des remplacements de texte basiques.
-except:XYZ 
Ignore les pages qui contiennent XYZ. Si l'argument -regex est donné, XYZ seront considérés comme des expressions rationnelles.
-fix:XYZ 
Effectue l'une des tâches prédéfinies, données dans le dictionnaire 'fixes' défini dans ce fichier. L'argument -regex et les remplacements spécifiés seront ignorés si vous utilisez -fix.
Les tâches prédinies actuellement disponibles sont :
  • HTML - convertit des balises HTML en code wiki, et corrige le XHTML.
-namespace:n 
Numéro de l'espace de nom à traiter.
-always 
Évite de devoir confirmer chaque remplacement. N'utilisez cet argument que si vous êtes certain que vous n'allez pas modifier certaines pages par erreur.
Autres arguments 
Le premier argument est le texte initial (à corriger), le second est le nouveau texte. Si l'argument -regex est utilisé, le premier argument sera considéré comme une expression rationnelle, et le second pourra contenir des des chaînes de caractères comme \\1 ou \g<name>.

Note : Utilisez l'un des arguments -xml ou -file ou -page, mais n'en utilisez pas plus d'un à la fois.

[modifier] Exemples

Si vous souhaitez changer des modèles de l'ancienne syntaxe (par exemple {{msg:ébauche}}) à la nouvelle syntaxe ({{ébauche}}), téléchargez un dump XML (table cur) à l'adresse http://download.wikimedia.org, puis utilisez la commande :

python replace.py -xml -regex "{{msg:(.*?)}}" "{{\1}}"

Si vous possédez un dump nommé foobar.xml et souhaitez faire des corrections typographiques (par exemple : Errreur -> Erreur), utilisez la commande :

python replace.py -xml:foobar.xml "Errreur" "Erreur"

S'il y a une page appelée 'John Doe' et que vous souhaitez convertir les balises HTML en syntaxe wiki, la commande est :

python replace.py -page:John_Doe -fix:HTML

Si vous lancez le bot sans les arguments, les remplacements à faire vous seront demandés plusieurs fois :

python replace.py -file:blah.txt

Le script demande à l'utilisateur avant de modifier un article. Il est recommandé de vérifie le résultat pour être sûr que le bot n'a pas introduit des erreurs (en particulier avec des mots mal orthographiés).

Il est possible de spécifier un groupe d'articles avec un fichier texte externe, contenant des liens wiki :

 [[avion]]
 [[véhicule]]
 [[train]]
 [[automobile]]

Le bot est ensuite lancé à l'aide d'une commande du type :

python replace.py -file:liste_articles.txt "errreur" "erreur"
Autres langues