ML (langage)

Un article de Wikipédia, l'encyclopédie libre.

ML (contraction de Meta Language) est un langage de programmation généraliste fonctionnel

[modifier] Histoire

ML fut initialement développé par Robin Milner et d'autres personnes dans les années 1980 à l'Université d'Edimbourg, pour le système de preuves formelles LCF. R. Milner rencontrait des difficultés avec le système de typage de LISP qui permettait de « prouver » des assertions fausses.

ML est un langage fonctionnel impur : il est possible de programmer en impératif, et par conséquent, les fonctions peuvent être sujettes à des effets de bord, contrairement à des langages purement fonctionnels comme Haskell.

ML a été standardisé en 1983, puis révisé en 1997 ; le langage résultant s'appelle SML (Standard ML), et a été notamment implémenté dans Standard ML of New-Jersey (SML/NJ). En parallèle, des équipes françaises ont développé Objective Caml, dont la popularité dans la communauté ML internationale est maintenant très grande.

[modifier] Fonctionnalités

Les fonctionnalités de ML incluent :

  • une gestion de mémoire automatique par un ramasse-miettes ;
  • un typage statique fort et polymorphe : le transtypage (cast en C) implicite est strictement interdit, ce qui supprime un grand nombre de bogues possibles. Le système de types évolué offert par le langage permet de définir précisément les types et les opérations autorisées sur les types et les structures de données. Il est possible de définir des fonctions génériques et d'écrire des fonctions qui prennent d'autres fonctions en paramètres (fonctions dites d'ordre supérieur). Ce système peut être vu comme une variante (plus expressive) de la généricité dans les langages impératifs (C++, Java) ;
  • l'inférence de types : il n'est nullement nécessaire de déclarer les variables. Le compilateur est capable de détecter leur type de façon non ambigüe grâce au contexte d'utilisation. Cela rend le code plus succinct et améliore la lisibilité ;
  • des types de données algébriques : on peut définir de nouvelles structures de données et les combiner de façon hiérarchique ;
  • le filtrage (en anglais : pattern matching) : c'est la possibilité de décomposer un type de donnée algébrique en ses différentes formes et de proposer un branchement pour chacune d'elles. Ce processus est plus ou moins comparable à l'identification de type à l'exécution dans d'autres langages mais est résolu statiquement en ML – et ne pénalise donc pas les performances à l'exécution ;
  • un système puissant de modules (appelés : structures) et d'interfaces (appelées : signatures). Les structures peuvent être paramétrées (on parle alors de foncteurs) et avoir plusieurs signatures, et vice-versa. Le paramétrage évoque les « templates » de C++ ou les « generic » d'Ada ou de Modula-3, à la différence près que le typage est complètement vérifié à la compilation ;
  • un système de gestion d'exceptions.

D'autres avantages du ML sont :

  • une grande sûreté (well-typed programs can't go wrong : un programme dont la compilation aboutit ne peut pas « planter », sur une erreur de type bien sûr) ;
  • une syntaxe compacte qui s'inspire de la notation mathématique, tout en restant lisible ;
  • une rapidité d'exécution souvent comparable à C++, surtout dans la version Objective Caml.

Les points forts de ML le rendent particulièrement apte à l'écriture de langages, de compilateurs et de systèmes de preuve formelle.

[modifier] Implémentations

Les principales implémentations sont le Standard ML et Objective Caml.

Standard ML :

  • SML of New Jersey (Bell Laboratories, Princeton University, Yale University, AT&T Research)
  • Moscow ML
  • MLton (NEC Research Labs): un compilateur optimisant extrêmement robuste et efficace

Objective Caml (INRIA), ne suit pas le standard SML mais est plutôt une évolution orientée objet de ML. Ce langage se caractérise par un compilateur produisant des programmes disposant d'une très grande rapidité d'exécution ainsi qu'une bibliothèque importante. Les développeurs et les utilisateurs forment une communauté très active pour un langage issu de la recherche.