Normalisation Unicode

Un article de Wikipédia, l'encyclopédie libre.

Unicode
Jeux de caractères
Équivalences normalisées
  • NFC (précomposée)
  • NFD (décomposée)
  • NFKC (compatibilité)
  • NFKD (compatibilité)
Propriétés et algorithmes
Codage
Autres transformations
Applications d'échanges de données

La normalisation Unicode est une normalisation de texte qui transforme des caractères ou séquences de caractères équivalents en représentation fondamentale afin que celle-ci puisse être facilement comparée.

Sommaire

[modifier] NFD

Les caractères sont décomposés par équivalence canonique et réordonnés.

Exemples 
  caractères   forme
normalisée
à a +  ̀ = a +   ̀
ẹ́ e +  ́ +  ̣ e +  ̣ +  ́
ñ ñ n +  ̃
Ω (ohm) Ω Ω (omega)
fi (ligature) =
² ² = ²

[modifier] NFC

Les caractères sont décomposés par équivalence canonique, réordonnés, et composés par équivalence canonique.

Exemples 
  caractères   forme
normalisée
à a +  ̀ à
ẹ́ e +  ́ +  ̣ ẹ +  ́
ñ ñ ñ
Ω (ohm) Ω Ω (omega)
fi (ligature) =
² ² = ²

[modifier] NFKD

Les caractères sont décomposés par équivalence canonique et de compatibilité, et sont réordonnés.

Exemples 
  caractères   forme
normalisée
à a +  ̀ = a +  ̀
ẹ́ e +  ́ +  ̣ e +  ̣ +  ́
ñ ñ n +  ̃
Ω (ohm) Ω Ω (omega)
fi (ligature) = f + i
² ² 2

[modifier] NFKC

Les caractères sont décomposés par équivalence canonique et de compatibilité, sont réordonnés et sont composés par équivalence canonique.

Exemples 
  caractères   forme
normalisée
à a +  ̀ à
ẹ́ e +  ́ +  ̣ ẹ +  ́
ñ ñ = ñ
Ω (ohm) Ω Ω (omega)
fi (ligature) f + i
² ² 2

[modifier] Voir aussi

[modifier] Liens externes

Autres langues