Table des caractères Unicode

Un article de Wikipédia, l'encyclopédie libre.

Tables Unicode

0000 – 0FFF		8000 – 8FFF
1000 – 1FFF		9000 – 9FFF
2000 – 2FFF		A000 – AFFF
3000 – 3FFF		B000 – BFFF
4000 – 4FFF		C000 – CFFF
5000 – 5FFF		D000 – DFFF
6000 – 6FFF		E000 – EFFF
7000 – 7FFF		F000 – FFFF

Autres plans Unicode

0000 – 0FFF		plan BMP
10000 – 10FFF		plan SMP
20000 – 20FFF		plan SIP
30000 – D0FFF		plans réservés
E0000 – E0FFF		plan SSP
F0000 – F0FFF		plan privé - A
100000 – 100FFF		plan privé - B

Unicode est une norme informatique développée par le Consortium Unicode qui vise à donner à tout caractère de n'importe quel système d’écriture de langue un identifiant numérique unique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel.

Unicode et la norme ISO/CEI 10646 attribuent à chaque caractère un nom officiel au sein d’un répertoire commun unifié entre toutes les langues et tous les usages. Dès que le répertoire commun est approuvé, les caractères sont groupés en blocs en fonction de leur usage et des écritures supportées, et reçoivent une identification numérique unique appelée point de code, identifiée généralement sous la forme U+xxxx (où xxxx est un nombre hexadécimal de 4 à 6 chiffres, entre U+0000 et U+10FFFF).

Sommaire

1 Localisation des caractères par plan et par bloc
2 Tables des plans de points de code Unicode
3 Voir aussi
- 3.1 Liens internes
- 3.2 Liens externes

[modifier] Localisation des caractères par plan et par bloc

Les blocs de points de code sont eux-même alloués dans des zones précises de l’espace de codage, lui-même divisé en 17 plans contenant chacun 65 536 points de code. Dans chacun des 17 plans, les deux derniers points de code sont alloués et réservés à des fonctions spéciales internes et non à des caractères, et ils ne doivent pas être utilisés pour le codage de textes.

[modifier] Tables des plans de points de code Unicode

La table suivante liste tous les 17 plans de points de code alloués dans les normes ISO/CEI 10646 et Unicode.

Note : vous pouvez utiliser la palette de navigation en haut de chaque page pour passer d’un bloc de 4096 points de codes à l’autre, ou encore d’un plan à un autre, ou pour afficher une carte d’allocation de chaque plan pour localiser les différentes écritures. En cliquant sur le nom d’un bloc, on affiche les informations plus détaillées sur le bloc, contenant les liens référençant les autres blocs contenant des caractères similaires.

Notez également que certaines de ces tables pourraient s'afficher mal sur votre écran, si vous n'utilisez pas ces polices de caractères sur votre ordinateur. Auquel cas il est possible de consulter ces tables en PDF (par exemple). On peut proposer au moins ce site (en)[1] le permettant.

[modifier] Plan multilingue de base (BMP)

Points de code U+0000 à U+FFFF.

Le plan multilingue de base (le premier, numéroté 0) est le plus utilisé car il contient la plupart des caractères utilisés par les langues modernes les plus courantes dans le monde.

[modifier] Plan multilingue supplémentaire (SMP)

Points de code U+10000 à U+1FFFF.

Ce plan supplémentaire (numéro 1) est déjà utilisé pour les caractères d’écritures anciennes.

[modifier] Plan idéographique supplémentaire (SIP)

Points de code U+20000 à U+2FFFF.

Ce plan supplémentaire (numéro 2) est utilisé pour des extensions nécessaires aux sinogrammes moins courants de l’écriture idéographique Chinois, japonais et coréen (CJC).

[modifier] Plans réservés supplémentaires

Points de code U+30000 à U+DFFFF.

Ces onze plans supplémentaires (numéros 3 à 13) ne sont pas encore utilisés.

[modifier] Plan spécial supplémentaire (SSP)

Points de code U+E0000 à U+EFFFF.

Ce plan supplémentaire (numéro 14) peu utilisé contient des caractères de contrôle spéciaux.

[modifier] Plans à usage privé supplémentaires

Points de code U+F0000 à U+10FFFF.

Ces deux plans supplémentaires (numéros 15 et 16) sont entièrement assignés à un usage privé au gré de l’utilisateur (les textes contenant ces points de code sont valides, mais non interopérable sans agrément mutuel privé préalable) et étendent les points de code privés du plan multilingue de base.

[modifier] Voir aussi

[modifier] Liens internes

[modifier] Liens externes

Sur le site officiel Unicode :
- (fr) Tableaux de caractères Unicode par écritures (dernière version normalisée 5.0).
- (en) The Unicode Character Code Charts By Script (dernière version normalisée 5.0).
- (en) Roadmaps to Unicode (écritures supportées ou en cours de normalisation).
(fr) Unicode et ISO 10646.
Normes librement téléchargeables sur le site de l'ISO (standards.iso.org) :
- (en) ISO 10646:2003 (Version anglaise au format zip, contenant des fichiers HTML et textes)
- (fr) ISO 10646:2003 (Version française au format zip, contenant des fichiers HTML et textes)