Binary Ordered Compression for Unicode

Un article de Wikipédia, l'encyclopédie libre.

Unicode
Jeux de caractères
Équivalences normalisées
  • NFC (précomposée)
  • NFD (décomposée)
  • NFKC (compatibilité)
  • NFKD (compatibilité)
Propriétés et algorithmes
Codage
Autres transformations
Applications d'échanges de données

Le BOCU-1 est un schéma de compression Unicode compatible MIME. BOCU signifie (en anglais: for Binary Ordered Compression for Unicode) Compression Ordonnées Binairmeent pour Unicode. BOCU-1 combine la large applicabilité d' UTF-8 avec la compacité du SCSU. Cet Unicode encoding est utile pour compresser de courtes chaînes, et maintient l'ordre des code point. Usuellement, les zip, bzip2, et autres algorithmes standards disponibles compressent de plus grandes quantités de textes plus efficacement.

SCSU a été créé comme schéma de compression Unicode avec un ration octet/code point similaire à ceux des code page spécifiques aux différentes langues. Il n'a pas été largement adopté bien que vérifiant les critères de jeu de caractères IANA et enregistré avec IANA. SCSU n'est pas disponible pour du type texte MIME . Par exemple, SCSU ne peut pas être utilisé directement dans les courriels et protocoles similaires. SCSU requirt un design d'encodeur compliqué pour avoir de bonnes performances.

C'est worth rien que le SCSU ait été adopté comme official Unicode Technical Standard. BOCU-1 n'a pas été officiellement adopté par le consortium Unicode, mais Unicode Technical Note #6 décrit cet encodage avec plus de détails.

[modifier] Liens externes

Autres langues