Caractère (informatique)

Un article de Wikipédia, l'encyclopédie libre.

Pour les articles homonymes, voir Caractère.

En informatique, un caractère est un type de données. Comme en typographie, un caractère informatique peut représenter une lettre minuscule, une lettre majuscule, un chiffre ou un signe de ponctuation, mais aussi une espace typographique, une tabulation, un retour à la ligne et quelques autres opérations spéciales (sonnerie, effacement, etc.).

Comme les ordinateurs travaillent sur des nombres binaires, chaque caractère reçoit un numéro, qui peut être codé sur un, deux, ou un nombre variable d'octets. Il existe plusieurs standards de codage de caractères, dont les plus connus sont ASCII, ISO 8859, et Unicode. Ainsi dans les standards ASCII, ISO 8859, et Unicode, le caractère «A» a reçu le numéro 65, «B» le 66, «a» le 97 et «,» le 44. Le caractère «é» n'existe pas en ASCII, qui ne contient que 128 caractères. En revanche, «é» a le numéro 233 en ISO 8859-1 et Unicode. Le caractère «» n'existe pas en ISO 8859-1. En revanche en Unicode, «» a reçu le numéro 8364. Ce dernier numéro ne peut pas être codé sur un seul octet car il faut 14 bits pour représenter 8364 en base 2 (10000010101100).

Les caractères informatiques permettent de directement représenter un texte brut, avec les espaces et les retours à la ligne, mais sans formatage plus élaboré (type de fonte de caractères, couleurs, tailles des caractères, etc.). Les caractères spéciaux étaient surtout utilisés par le matériel informatique (terminaux et imprimantes) d'avant les années 1990 qui ne fonctionnait qu'en mode texte.

L'affichage d'un caractère sur un écran ou son impression avec une imprimante nécessite les données spécifiant le dessin exact du caractère, le glyphe. Comme en typographie, un ensemble de glyphes d'une même famille de caractères est une police de caractères.

Très souvent les ordinateurs traitent des mots, des phrases, des paragraphes entiers. Il existe un type de données pour représenter une suite de caractères, c'est la chaîne de caractères.

[modifier] Voir aussi