Binary Ordered Compression for Unicode
Un article de Wikipédia, l'encyclopédie libre.
Unicode |
---|
Jeux de caractères |
Équivalences normalisées |
Propriétés et algorithmes
|
Codage
|
Autres transformations |
Applications d'échanges de données |
Le BOCU-1 est un schéma de compression Unicode compatible MIME. BOCU signifie (en anglais: for Binary Ordered Compression for Unicode) Compression Ordonnées Binairmeent pour Unicode. BOCU-1 combine la large applicabilité d' UTF-8 avec la compacité du SCSU. Cet Unicode encoding est utile pour compresser de courtes chaînes, et maintient l'ordre des code point. Usuellement, les zip, bzip2, et autres algorithmes standards disponibles compressent de plus grandes quantités de textes plus efficacement.
SCSU a été créé comme schéma de compression Unicode avec un ration octet/code point similaire à ceux des code page spécifiques aux différentes langues. Il n'a pas été largement adopté bien que vérifiant les critères de jeu de caractères IANA et enregistré avec IANA. SCSU n'est pas disponible pour du type texte MIME . Par exemple, SCSU ne peut pas être utilisé directement dans les courriels et protocoles similaires. SCSU requirt un design d'encodeur compliqué pour avoir de bonnes performances.
C'est worth rien que le SCSU ait été adopté comme official Unicode Technical Standard. BOCU-1 n'a pas été officiellement adopté par le consortium Unicode, mais Unicode Technical Note #6 décrit cet encodage avec plus de détails.
[modifier] Liens externes
- Unicode Technical Note #6 BOCU-1: MIME Compatible Unicode Compression
- International Components for Unicode A library that can convert between BOCU-1 and other Unicode encodings