Espace insécable

Un article de Wikipédia, l'encyclopédie libre.

Une espace insécable est un caractère typographique consistant en une espace que l’on intercale entre deux mots (ou un mot et une ponctuation) qui ne doivent pas être séparés par un éventuel retour à la ligne automatique. L’espace insécable permet d’éviter qu’un mot ou une ponctuation soit rejeté et isolé en début de ligne lorsque cela nuirait à la fluidité de la lecture.

Le code typographique français recommande, contrairement à d'autres langues telles que l’anglais, une espace insécable devant les signes de ponctuation doubles (point-virgule, deux-points, point d'interrogation, point d'exclamation) ainsi que comme séparateur des groupes de caractères (séparateur de groupes de 3 chiffres dans les nombres supérieurs au millier, séparateur sans valeur facilitant la lecture des numéros de téléphone ou des numéros et codes d’identification, etc.).

[modifier] Codage ou représentation de l’espace insécable dans différentes normes de documents

  • En Unicode, l’espace insécable est représentée par le point de code décimal 160, c’est-à-dire U+00A0. Le codage effectif de ce point de code dans un document dépend du codage de jeu de caractères codés utilisé dans ce document et peut donc nécessiter plusieurs octets, par exemple :
    • avec le codage UTF-8 qui nécessite de le représenter sur deux octets successifs de valeur hexadécimale 0xC2 0xA0,
    • ou avec le codage UTF-16BE qui nécessite les deux octets 0x00 0xA0 (codés dans cet ordre),
    • ou le codage UTF-16LE qui nécessite les deux octets 0xA0 0x00 (codés dans cet ordre),
    • ou bien le codage UTF-32BE qui nécessite les quatre octets 0x00 0x00 0x00 0xA0 (codés dans cet ordre),
    • représentation sur 4 octets en ordre inverse avec le codage UTF-32LE ;
  • Avec les autres codages de jeu de caractères codés non normalisés par Unicode, le codage effectif dépend d’une part de la table l’assignation des points de code Unicode en codets du jeu de caractères codés associé à ce codage, et d’autre part de la méthode, spécifique à ce codage, pour la représentation de ses codets en séquences d’octets ou de mots.
    • Par exemple, dans tous les codages de jeux de caractères codés basés sur la norme ISO 8859, l’espace insécable est représenté par un codet numérique de valeur égale à celle de son point de code dans Unicode et est alors codé dans le document par un octet unique, de valeur égale à ce codet, donc avec un seul octet de valeur décimale égale à 160, ou 0xA0 en hexadécimal.
  • Dans les documents de type SGML, HTML ou XML, l’espace insécable peut être soit codé directement (en utilisant le codage de jeu de caractères codés déclaré pour ce document, codage qui peut alors être quelconque), ou bien représenté par une entité numérique de caractère décimale   ou hexadécimale  , toujours basé sur la valeur numérique du point de code Unicode indépendamment du jeu de caractères codés déclaré ou utilisé pour le document (et même si le jeu de caractères codés associé à ce codage, par exemple US-ASCII, ne contient aucun codet pour représenter l’espace insécable).
    • De plus, dans les documents de type SGML ou HTML, l’espace insécable peut aussi être représenté par l’entité nommée   (sigle de l'anglais « non breaking space »), prédéfinie comme équivalente à l’entité numérique. Au contraire des entités numériques, cette entité nommée n’est pas prédéfinie dans tous les documents XML qui doivent alors, soit la définir explicitement dans l’en-tête de déclaration de type de document, soit le plus souvent l’importer indirectement avec une déclaration de DTD (comme par exemple dans les documents XHTML).
  • Dans les documents de type TeX, pour représenter un espace insécable, on doit le coder avec un caractère '~' (tilde), qui sera automatiquement interprété lors du traitement du document par le logiciel (dont LaTeX, un logiciel libre de traitement de texte).

[modifier] Saisie de l’espace insécable dans les logiciels de PAO

[modifier] Liens externes