Méthodes d'encodage du chinois sur ordinateurs

Un article de Wikipédia, l'encyclopédie libre.

La langue chinoise utilise des sinogrammes pour son écriture. Un mot compte rarement plus de un ou deux "caractères". Mais il existe beaucoup plus de caractères (ou glyphes ou sinogrammes) que de touches sur un clavier d'ordinateur tel que celui généralement utilisé dans le monde. Les premiers ordinateurs chinois utilisaient cependant des claviers de plusieurs milliers de touches.

Un clavier expérimental de sinogrammes
Un clavier expérimental de sinogrammes

De nombreuses méthodes d'entrée (ou IME en anglais) ont été conçues pour permettre au mieux l'encodage des caractères chinois par des claviers standards.

Les méthodes d'encodage des caractères chinois au clavier peuvent être classées en trois grandes familles : par encodage, par prononciation et par structure des caractères. Ci-dessous quelques exemples des méthodes développées. Pinyin complet et Pinyin double sont des variations de la méthode d'encodage pinyin. De plus, les méthodes qui demandent à l'utilisateur de choisir parmi un nombre de possibilités proposées disposent généralement de techniques avancées qui permettent d'afficher dans le menu le caractère le plus probable (contexte, fréquence, expressions).

Suivant les préférences personnelles et le type d'utilisateur, ces méthodes conviennent mieux à l'une ou l'autre personne, chaque méthode ayant par ailleurs ses qualités et ses faiblesses. Par exemple, pour une personne habituée au pinyin, la méthode pinyin peut être rapidement maîtrisée. Cependant, la vitesse d'encodage par ces méthodes est limitée, et n'est à portée que des personnes maitrisant le pinyin. La méthode Wubi demande plus d'effort pour être apprise, mais elle permet une fois pleinement maîtrisée un encodage plus rapide qu'avec les méthodes phonétiques. Pour ces raisons, il ne semble pas qu'une méthode "standard" d'encodage du chinois puisse être envisagée à terme.

Il existe d'autres moyens moins courants pour réaliser l'encodage de caractères chinois, dont par exemple certains utilisant un stylet et une tablette, et qui numérisent les caractères écrits par l'intermédiaire d'un logiciel de reconnaissance de l'écriture ou éventuellement des logiciels de reconnaissance du langage.

Comme pour les autres langues, dont le français, ces méthodes ne permettent l'encodage des caractères que moyennant un taux d'erreurs relativement élevé.

Certains systèmes permettent l'encodage de caractères chinois en tapant simplement leur équivalent anglais.

[modifier] Prononciation

[modifier] Structure du caractère

[modifier] Combinaison de prononciation et de la structure du caractère

[modifier] Voir aussi

[modifier] Codage de caractères

Article principal : en:Chinese character encoding

[modifier] Autres

[modifier] Liens externes

Autres langues