ISO 639

Un article de Wikipédia, l'encyclopédie libre.

L’ISO 639 (ICS n°01.140.20) est une norme internationale l'ISO qui définit des codes pour la représentation des noms de langues.

Les langues sont représentées par un code unique de 2 ou 3 lettres, par exemple fi et fin sont associés au finnois. Le standard est composé actuellement de trois parties, dont la publication s'est déroulée de 1998 à 2007, et trois autres parties sont encore en projet.

La norme se compose de différentes parties :

  • ISO 639-1 (2002) : Codes pour la représentation des noms de langue - Partie 1 : Codes alpha-2 (liste des codes ISO 639-1)
  • ISO 639-2 (1998) : Codes pour la représentation des noms de langue - Partie 2 : Codes alpha-3 (liste des codes ISO 639-2)
  • ISO 639-3 (2007) : Codes pour la représentation des noms de langues - Partie 3 : Codes alpha-3 pour un traitement exhaustif des langues
  • ISO/CD 639-4 (2009?) : Codes pour la représentation des noms de langue -- Partie 4 : Lignes directrices pour la mise en oeuvre et principes généraux des codes de langue
  • ISO/DIS 639-5 (2008) : Codes pour la représentation des noms de langue - Partie 5 : Code alpha-3 pour les familles de langues et groupes de langues
  • ISO/CD 639-6 (2009?) : Codes pour la représentation des noms de langues - Partie 6 : Représentation alpha-4 pour un traitement exhaustif des variantes linguistiques

Sommaire

[modifier] Codes alpha-2

Les codes à 2 caractères latins, utilisé par l'ISO 639-1, donnent la possibilité de coder 262=676 langues différentes. Ceci est insuffisant pour coder l'ensemble des langues (estimé de 4000 à 7000), ce qui est réalisé par les normes ISO 639-2 et ISO 639-3 qui utilisent des codes à 3 lettres. La norme ISO 639-1 associe chaque code au nom de la langue en français et en anglais.

[modifier] Codes alpha-3

Les codes à 3 caractères latins donnent la possibilité de coder 263=17 576 langues différentes. Les codes à 3 lettres sont utilisés par l'ISO 639-2 et l'ISO 639-3.

L'ISO 639-2 définit en plus de l'ISO 639-1 des codes désignant des groupes de langues (arabe, quechua, chinois…), ainsi que des codes spéciaux mis (utilisé pour une langue identifiée mais qui ne disposent ou ne disposaient pas encore de codes alpha-2 ou alpha-3, ce code étant complété souvent d’extensions codifiées pour l’écriture utilisée et l’emplacement géographique, ou non codifiées pour les variantes linguistiques), mul (pour codifier les contenus multilingues), und (pour codifier toute langue inconnue ou non complètement déterminée), zxx réservé à l’usage privé, et un espace réservé qaa-qtz (520 autres codes à usage privé).

Certaines langues (23 en tout) sont codées dans l'ISO 639-2 par deux codes différents : bibliographique et terminologique. Par exemple pour l'allemand, on a : ger pour le code bibliographique (conservé pour des raisons de compatibilité historique avec les systèmes d’échanges et de classification d’information bibliographiques normalisés dans certains pays) et deu pour le code terminologique (à utililiser dans tous les autres cas, y compris pour l’usage selon la norme technique RFC 4646 / BCP 47) ; de même le code alpha-3 bibliographique pour le français est fre mais le code alpha-3 terminologique est fra.

L'ISO 639-3, publié en 2007, vise à répertorier le plus grand nombre possible de langues. Celles-ci peuvent être d'une part des langues individuelles (exemple : arménien, hye, des macrolangues (exemple : albanais, sqi ou des collections de langues (exemple : langues algonquiennes, alg) ; et d'autre part des langues vivantes (exemple : irlandais, gle), éteintes (récemment, par exemple kato, ktw), anciennes (disparues il y a longtemps, par exemple : vieux norrois, non), historiques (distinctes de langues modernes, mais dont ces dernières descendent de la langue considérée, par exemple moyen anglais, enm) ou construites (exemple : klingon, tlh). SIL International est l'auteur principal de l'ISO 639-3.

L’ISO 639-5, dont une première version a été publiée le 15 mai 2008, vise à classer l’ensemble des langues individuelles en familles de langues et groupes de langues selon un système plus complet que ce que permet l’ISO 639-3, en attribuant des codes alpha-3 supplémentaires pour ces familles et groupes de langues, ce que ne permet pas l’ISO 639-3 qui ne permet que des codes collectifs regroupant parfois des langues isolées de différents groupes et non mutuellement intelligibles ou des groupes trop restreints de langues. Cette norme vise aussi à faciliter la localisation des logiciels et améliorer globalement le traitement des langues plus rares en les rapprochant de langues plus proches au lieu d’utiliser une langue de repli unique (souvent l’anglais dans une version simplifiée et parfois inprécise).

[modifier] Voir aussi

[modifier] Articles connexes

[modifier] Liens externes