UNIX

Un article de Wikipédia, l'encyclopédie libre.

Principaux systèmes
d'exploitation
BSD
FreeBSD - NetBSD - OpenBSD
DragonFly BSD - PC-BSD
GNU/Linux (Liste)
Debian - Fedora - Gentoo
Mandriva - Red Hat - Slackware
SuSE - Ubuntu
Mac OS
Système 5 - 6 - 7 - 8 - 9
Mac OS X -.0 -.1 -.2 -.3 -.4 -.5- .6 - Server
MS-DOS - Microsoft Windows
1.0 - 2 - 3.x - 95 - 98 - Me
NT - 3.5x - 4.0 - 2000
XP - 2003 - Vista - 2008
Seven (en développement)
Autres
AmigaOS - BeOS - Inferno
LynxOS - Haiku OS - OS/2
QNX - Solaris - UNIX - MVS
OS/360 - OS/390 - OS/400 - Plan 9
ReactOS - VMS - ZETA - FreeDOS
filiation des systemes Unix.
filiation des systemes Unix.

UNIX™ est le nom d'un système d'exploitation multitâche et multi-utilisateur créé en 1969, à usage principalement professionnel, conceptuellement ouvert et fondé sur une approche par laquelle il offre de nombreux petits outils chacun dotés d'une mission spécifique. Il a donné naissance à une famille de systèmes, dont les plus populaires en 2008 sont Linux et Mac OS X. On nomme famille Unix l'ensemble de ces systèmes. On dit encore qu'ils sont de type Unix et on les qualifie d'Unices. Il existe aujourd'hui un ensemble de standards réunis sous la norme POSIX qui vise à unifier certains aspects de leur fonctionnement.

Sommaire

[modifier] Histoire

[modifier] La genèse d'UNIX

En 1969, Ken Thompson qui travaille alors pour les laboratoires Bell développa la première version d'un système d'exploitation mono-utilisateur sous le nom de "New Ken's System". Il réalisa ce travail sur un mini-ordinateur PDP-7 (Programmed Data Processor) de marque DEC animé par GCOS et rédigea le nouveau logiciel en langage d'assemblage. Le nom Unics fut suggéré par Brian Kernighan suite à un jeu de mot "latin" avec Multics; "Multi- car Multics faisait la même chose de plusieurs façons alors qu'Unics faisait chaque chose d'une seule façon". Ce nom fut par la suite contracté en Unix (pour au final être déposé sous le nom UNIX par AT&T), cependant personne ne se souvient de qui est à l'origine de la modification du "cs" en "x".

Un décret datant de 1956 interdisait à l'entreprise AT&T, dont dépendait Bell Labs, de commercialiser autre chose que des équipements téléphoniques ou télégraphiques. C'est la raison pour laquelle la décision fut prise en 1973 de distribuer le système UNIX complet avec son code source dans les universités à des fins éducatives, moyennant l'acquisition d'une licence au prix très faible.

En 1971, conscient de la difficulté que représente la maintenance d'un système écrit en langage d'assemblage, Ken Thompson songea à réécrire UNIX en TMG, mais il trouva que le TMG n'offrait pas ce dont il avait besoin. Pendant une courte période il songea à réécrire UNIX en Fortran, mais finalement conçut le B avec l'aide de Dennis Ritchie (1969-1970), en s'inspirant du langage BCPL. Cependant UNIX ne fut jamais réécrit en B ; le B ne supportait pas de "types", toutes les variables étaient de la même taille que les mots (word) de l'architecture, l'arithmétique sur les flottants n'était pas vraiment implémentée ; de plus le compilateur B utilisait la technique du "threaded code". C'est pourquoi Dennis Ritchie entreprit en 1971 le NB (New B), qui fut renommé en C, en commençant par créer des types.

Ken Thompson et Dennis Ritchie présentent le premier article sur UNIX au Symposium on Operating Systems Principles à l'Université de Purdue en 1973. Le professeur Bob Fabry de l'université de Californie Berkeley (UCB), alors dans l'auditoire, est immédiatement intéressé et en janvier 1974 Keith Standiford, étudiant de 2e cycle, installe la Version 4 à l'UCB, distribuée sur bande magnétique. Début 1975, Ken Thompson passe une année comme professeur invité à son alma mater, l'UCB. Avec Jeff Schriebman et Bob Kridle, ils mettent sur pied la Version 6. C'est à ce moment, qu'UNIX fut diffusé hors des laboratoires Bell.

A l'automne de cette année, Bill Joy et Chuck Haley, alors en 2e cycle, s'intéressent au nouveau système et implémentent l'éditeur en ligne ex en Pascal, et finissent par explorer le fonctionnement du noyau au moment du départ de Ken Thompson.

Le développement fut également rejoint par Alan Snyder, Steven C. Johnson, Michael Lesk dans cette période allant de 1973 à 1977. Au début de cette dernière année, Bill Joy réalise la première Berkeley Software Distribution.

Plus tard, avec l'arrivée de nouveaux terminaux, il écrit vi (l'éditeur visuel), une surcouche de ex. L'été 1978, la Second Berkeley Software Distribution ou 2BSD voit le jour. Puis en décembre 1979, Bill Joy distribue la 3BSD, la première qui supporte les ordinateurs VAX de DEC. Unix atteint alors sa version 7, son évolution s'accompagnant de nombreuses modifications notables telles que l'extension à 2 Go de la taille maximale d'un fichier, l'ajout de plusieurs utilitaires, et surtout la portabilité du système. C'est à cette époque que le premier grand portage d'UNIX, la version 32/V, fut réalisé, sur un VAX 11/780.

[modifier] L'expansion

Dès la fin de l'année 1977, des chercheurs de l'Université de Californie apportèrent de nombreuses améliorations au système UNIX fourni par AT&T et le distribuèrent sous le nom de Berkeley Software Distribution (ou BSD). Ainsi BSD fut par exemple le premier système UNIX à exploiter pleinement le mécanisme de mémoire virtuelle paginée du VAX 11/780.

Trois branches de développement des sources virent le jour :

  • La branche de recherche d'AT&T qui développa, toujours aux laboratoires Bell, jusqu'en 1990, les 8e, 9e et 10e éditions du système UNIX.
  • La branche commerciale d'AT&T qui développa System III, puis quatre éditions de System V (System V, SVR2, SVR3, SVR4).
  • Berkeley Software Distribution développé par l'Université de Californie, jusqu'en 1994.

Ces branches se sont mutuellement empruntées du code et/ou des concepts. Ainsi :

chronologie et filliation des différents unix et apparentés
chronologie et filliation des différents unix et apparentés
  • La 8e édition est issue de la version 4.1 BSD.
  • La version SVR3 a emprunté le concept des STREAMS à la 8e édition.
  • La version SVR4 a intégré beaucoup de code de la version 4.3 BSD.
  • La version 4.4 BSD comporte une très petite quantité de code de la version SVR4.

[modifier] Le rôle de la DARPA

Lors de la publication de 3BSD en 1979 la Defense Advanced Research Projects Agency (DARPA) prend connaissance des avancées réalisées à l'UCB. Ils ont l'intention d'utiliser UNIX pour leurs projets. En automne de cette même année, Bob Fabry propose à la DARPA une version augmentée de 3BSD pour répondre à leurs besoins. Un contrat de 18 mois est signé en avril 1980, et Bob Fabry rassemble une équipe. Bill Joy, qui vient juste de passer sa soutenance de thèse (doctorat), se propose de participer. Les versions se succèdent jusqu'à 4.1BSD. Satisfaite, la DARPA signe pour deux ans supplémentaires et le budget est presque multiplié par cinq. Le nombre de personnes impliquées croît vite. Le steering committee est formé pour aider à définir l'évolution du système.

Ce groupe se réunit deux fois par an entre avril 1981 et juin 1983, et comprend :

  • Bob Fabry, Bill Joy, Sam Leffler (UCB)
  • Alan Nemeth, Rob Gurwitzn, Beranek, Newman
  • Dennis Ritchie (Bell Laboratories)
  • Keith Lantz (Stanford University)
  • Rick Rashid (Carnegie-Mellon University)
  • Bert Halstead (Massachusetts Institute of Technology)
  • Dan Lynch (Information Sciences Institute)
  • Duane Adams, Bob Baker (DARPA)
  • Jerry Popek (University of California, Los Angeles)

A partir de 1984, ce sont des ateliers réunissant bien plus de personnes qui prennent le relai.

[modifier] TCP/IP : la première implémentation ou la naissance d'Internet

C'est Rob Gurwitz qui publie la première implémentation des protocoles TCP/IP, les protocoles de l'Internet d'aujourd'hui. Bill Joy l'intègre au système et ajuste les performances. Cette implémentation est considérée par beaucoup comme l'implémentation de référence. Elle est reprise plus tard par Microsoft pour ses Windows.

Vers la fin de l'été 1982, Bill Joy annonce qu'il rejoint Sun Microsystems, alors Sam Leffler prend la responsabilité de faire aboutir le projet.

En août 1983, 4.2BSD est publié, Sam Leffler quitte l'UCB pour Lucasfilm et Mike Karels le remplace. 4.2BSD est alors très populaire et est plus vendue que toutes les autres distributions réunies, et que le System V d'AT&T, en particulier parce que ce dernier n'avait ni la communication par réseau ni le système de fichiers FFS (Berkeley fast filesystem)

A la conférence Usenix de 1985, 4.3BSD est annoncé. De nouvelles architectures matérielles apparaissent, et le noyau est scindé en parties dépendantes et indépendantes du matériel (4.3BSD-Tahoe).

[modifier] De l'open Source au librement redistribuable

Jusqu'à 4.3BSD-Tahoe, la licence AT&T sur les sources et les sources sont toujours distribuées. Les utilisateurs ne sont pas des utilisateurs passifs mais participent activement au développement. La licence d'AT&T sur les sources étant devenue excessivement chère, les sources sont nettoyées du code d'AT&T, et en juin 1989, la première BSD libre, la Networking Release 1 ou Net/1 est publiée. La licence est volontairement très libérale : le logiciel peut être redistribué ou vendu, avec ou sans modification des sources, ce sous forme binaire (compilée) ou non. Les notices de copyright dans les sources doivent être laissées intactes, et la documentation doit mentionner l'origine du code (l'UCB). Net/1 alors coûte 1000 dollars à l'UCB pour la bande magnétique qui le transporte, et est mis à disposition par connexion FTP (file transfert protocol) anonyme (pas de mot de passe requis).

Le système de mémoire virtuelle du système d'exploitation MACH de l'université Carnegie-Mellon est importé, et 4.3BSD-Reno sort début 1990.

[modifier] NetBSD, FreeBSD

figure 1. Généalogie des systèmes Unix.
figure 1. Généalogie des systèmes Unix.

Bill Jolitz à partir de Networking Release 2 publie 386/BSD, destiné à une architecture PC (386), mais est vite débordé quant à sa maintenance. Quelques mois après sa publication, des utilisateurs de 386BSD forment le groupe NetBSD, et rassemblent leurs ressources pour maintenir et augmenter ce système. Leurs objectifs sont alors de faire en sorte que NetBSD fonctionne sous n'importe quel matériel. Le public cible de NetBSD est des développeurs-administrateurs de haute technicité.

Encore quelques mois plus tard, le groupe FreeBSD se forme et décide lui de se focaliser sur l'architecture PC. En décembre 1993, grâce au soutien de Walnut Creek CDROM, FreeBSD 1.0 est publié.

[modifier] Les UNIX propriétaires

Dès 1977, AT&T mit les sources d'UNIX à la disposition des autres entreprises, si bien qu'un grand nombre de dérivés d'UNIX furent développés :

  • XENIX, fondé sur la 7e édition développé en 1980 par Microsoft.
  • AIX, développé par IBM, dont la première version de 1986 fut basée sur System V release 2.
  • Solaris, développé par Sun Microsystems, basé au départ sur BSD 4.1c en 1981, puis sur System V release 4 (SVR4).
  • HP-UX, fondé sur System V, développé à partir de 1986 par Hewlett-Packard
  • Ultrix, développé par DEC. La version Ultrix-11, destinée aux machines de la famille PDP-11, est basée sur la 7e édition, avec des ajouts provenant de System V et de BSD. La version Ultrix-32, destinée aux machines de la famille VAX, est essentiellement fondée sur BSD.
  • IRIX, développé par SGI depuis 1986.
  • UnixWare, descendant de SVR4, développé par Novell puis revendu à SCO Group.
  • SCO Group UNIX, fondé sur XENIX et System V développé dès 1979 par Santa Cruz Operations et Hewlett-Packard.
  • Tru64, fondé sur une version du micro-noyau Mach 2.5 réalisée par le consortium OSF (Open Software Foundation). Il a d'abord été développé sous le nom OSF/1 puis DEC UNIX par Digital Equipment Corporation, Compaq et enfin Hewlett Packard.
  • A/UX, un UNIX développé par Apple, compatible avec Mac OS.

En 1982, AT&T annonça le support de son produit, la version System III, qui constitue de ce fait sa première version commerciale d'UNIX. En 1983 suivit la version System V.

[modifier] Minix, XINU et GNU/Linux

En 1985, un professeur américain domicilié aux Pays-Bas, Andrew S. Tanenbaum, développa un système d'exploitation minimal, baptisé Minix, afin d'enseigner les concepts des systèmes d'exploitation à ses étudiants. Un projet similaire nommé XINU (pour Xinu Is Not Unix) fit aussi son apparition dans les années 1980 sous la direction de Douglas Comer.

En 1991 un étudiant finlandais, Linus Torvalds, décida de concevoir, sur le modèle de Minix, un système d'exploitation capable de fonctionner sur les architectures à base de processeur Intel 80386. Le noyau, qui était alors au stade expérimental, devait être généré sur un système Minix.

Linus baptisa son système Freax et posta le message suivant sur le groupe de discussion comp.os.minix :

« Hello everybody out there using minix - I'm doing a (free) operating system (just a hobby, won't be big and professional like gnu) for 386(486) AT clones. »
    —  [1]

Le nom de « Linux » vient en fait de la personne qui hébergeait le projet pour sa diffusion (version 0.0.1) et non d'un choix égocentrique de Linus. Il voulut un temps rebaptiser son système Freax, mais il était trop tard, Linux s'était déjà imposé auprès des aficionados. Linux ne contient pas de code provenant d'UNIX, mais c'est un système inspiré d'UNIX et complètement réécrit. D'autre part, Linux est un logiciel libre.

Linux lui même n'étant qu'un noyau, il utilise l'ensemble des logiciels du projet GNU pour faire un système d'exploitation complet.

[modifier] Mac OS X

Unix est à l'origine de Mac OS X, l'actuelle version du système d'exploitation d'Apple. Mac OS X est basé sur le même noyau que MkLinux, Darwin, et XNU: un micro-noyau Mach. Toutefois, la couche Unix de MacOSX n'est pas une personnalité du noyau Mach, l'intégration est plus subtile puisqu'elle s'apparente plutôt à une greffe de l'un sur l'autre.

En mai 2007, la version 10.5 (Leopard) de MacOSX sur Intel a reçu la certification UNIX 03 du Open Group[2].

[modifier] À l'heure actuelle

Voici un schéma non exhaustif retraçant globalement l'apparition des principaux systèmes de type UNIX :

L'incompatibilité grandissante entre les nombreuses variantes d'UNIX proposées par les différents éditeurs pour les différentes machines a fini par porter atteinte à la popularité d'UNIX. De nos jours, les systèmes UNIX propriétaires, longtemps majoritaires dans l'industrie et l'éducation, sont de moins en moins utilisés. En revanche, trois systèmes de type UNIX basés sur BSD (FreeBSD, NetBSD et OpenBSD) d'une part, et le système GNU/Linux, compatible UNIX, d'autre part, ainsi que Mac OS X (basé sur Darwin), occupent une part de marché de plus en plus importante.

[modifier] Les procès

Début 1992, Unix System Laboratories (USL), composante d'AT&T chargée de développer et vendre Unix, commence à poursuivre Berkeley Software Design, Incorporated (BSDI), mise en place pour développer et vendre une version commerciale. Le procès n'aboutit pas comme le souhaitait USL qui lance alors un autre procès contre BSDI et l'UCB. USL est vendu par AT&T à Novell. En janvier 1994, un accord est trouvé :

  • 2 fichiers sur 18 000 sont retirés de Net/2
  • un certain nombre de changements mineurs sont faits sur d'autres fichiers
  • une notice de copyright est ajoutée à environ 70 fichiers (qui restent librement distribuables)

En janvier 1995, FreeBSD 2.0 sort avec les nouveaux fichiers de Net/2, alors appelée 4.4BSD-Lite, et des éléments de 386BSD (figure 1).

[modifier] Stations de travail et serveurs Unix

Seuls quelques grands constructeurs de stations de travail et de serveurs développant des dérivés d'UNIX subsistent en 2007 :

Microsoft a possédé quelque temps les droits d'une version d'UNIX qui se nommait XENIX.

La philosophie des constructeurs de stations et serveurs UNIX a été au départ de développer un système d'exploitation pour pouvoir vendre leurs machines, en y ajoutant si possible un petit « plus » pour se démarquer de la concurrence. C'était oublier que les parcs UNIX sont le plus souvent hétérogènes et que toute différence d'une machine à l'autre, même créée avec la meilleure intention du monde, menace l'interopérabilité donc constitue un risque réel de contre-productivité car contraignent les informaticiens à bricoler afin d'interconnecter les systèmes.

C'est une des raisons pour lesquelles nombre de ces constructeurs proposent désormais le système GNU/Linux avec leurs serveurs. Toutefois, si le noyau Linux est bien défini, le système Linux change sensiblement d'une distribution à l'autre, ce qui conduit à des dissemblances causant parfois des pertes de temps.

Ce problème se posait déjà jadis avec l'opposition entre UNIX System V et UNIX BSD, en particulier sur des gestions sensiblement différentes de l'impression et des signaux.

[modifier] Le système UNIX

Le système UNIX est multi-utilisateur et multitâche, il permet donc à un ordinateur mono ou multi-processeurs d'exécuter apparemment simultanément plusieurs programmes dans des zones protégées appartenant chacune à un utilisateur.



[modifier] Le standard UNIX

Le grand nombre de systèmes UNIX développés sur la base du System V de AT&T ou bien de BSD conduisit des membres du groupe d'utilisateurs /usr/group, qui a pris depuis le nom de UniForum, à forger un standard UNIX dès 1981 afin d'assurer une portabilité maximale entre les différents systèmes :

  • en 1984 le groupe /usr/group publie POSIX, une série de standards développés sous couvert de l'IEEE (Institute of Electrical and Electronics Engineers). POSIX est ainsi également connu sous le nom IEEE P1003.
  • en 1985, AT&T publie SVID (System V Interface Definition) décrivant le System V. Cette première définition est différente de POSIX.
  • à la même époque, un consortium de constructeurs (Sun, IBM, HP, DEC, AT&T, Unisys, ICL, etc.) publie le standard X/Open Portability Guide Issue 3 (XPG3). Ce standard s'occupe tout particulièrement des différences issues de la localisation géographique (date, alphabet, etc.).

[modifier] Aspects techniques

Le noyau d'UNIX repose sur quatre concepts élémentaires : les fichiers, les processus, les IPC (communications inter-processus), et les droits d'accès :

[modifier] Fichiers

Le fichier est l'unité élémentaire de gestion de ressources sous UNIX. Un fichier sous UNIX n'est pas typé, ce qui veut dire que le système ne connaît pas le format des données qu'il contient, et peut représenter différentes ressources telles qu'une suite de caractères stockée sur un support physique, un périphérique (disque dur, imprimante, dérouleur à bandes, mémoire, interface réseau etc.), ou même des paramètres dynamiquement reconfigurables du noyau. Un fichier est un objet référencé dans un système de fichiers. Cette référence contient toutes les informations nécessaires au traitement de ce fichier : propriétaire, groupe (chaque fichier étant détenu par un propriétaire faisant partie d'un ou plusieurs groupes, le propriétaire et chaque groupe possèdent des droits particuliers), droits d'accès des différentes catégories d'utilisateurs, taille, date de dernière modification, date du dernier accès, références des blocs de données sur le disque s'il représente une suite de caractères.

[modifier] Processus

Le processus est l'unité élémentaire de gestion des traitements sous UNIX. Il s'agit d'une abstraction comprenant un espace d'adressage et supportant un ou plusieurs flots d'exécution de programme, les threads, chacun possédant une pile et son propre contexte d'exécution. UNIX étant un système multitâche, il permet de partager les ressources de calcul entre les threads. D'autre part il est préemptif, ce qui implique que ce partage est effectué de manière transparente pour les threads. Ce partage transparent est réalisé grâce à un ordonnanceur adapté à l'usage auquel est destiné le système. Dans un système à temps partagé, l'ordonnanceur tente de répartir les ressources de calcul de manière équitable entre les threads tout en privilégiant le temps de réponse des entrées/sorties. Dans un système temps-réel, les threads sont ordonnancés selon des contraintes temporelles qui doivent être garanties strictement (temps-réel dur) ou bien avec un certain taux d'échec (temps-réel souple).

[modifier] Communications inter-processus (IPC)

Les communications inter-processus servent à arbitrer l'utilisation de ressources partagées entre différents processus ou threads par le biais d'objets de synchronisation tels que les sémaphores ou les mutex, à permettre le contrôle d'un processus par un autre ou bien par le noyau par le biais de signaux, et enfin à permettre à deux processus d'établir une communication : localement par le biais de pipes, de segments de mémoire partagée ou de files de messages, et de manière transparente (localement ou sur un réseau) par le biais de sockets.

[modifier] Contrôle d'accès aux ressources

Au niveau logiciel, la politique de sécurité du système UNIX est fondée sur le principe que chaque ressource admet un identificateur, un propriétaire et un ensemble de droits d'accès (en lecture, en écriture, en exécution) répartis en trois groupes : 1) les droits du propriétaire; 2) les droits du groupe auquel appartient le propriétaire; 3) les droits des autres utilisateurs. La plupart des systèmes UNIX actuels proposent un modèle plus fin, celui des listes de contrôle d'accès (ACL - Access Control List). Un utilisateur spécial appelé root possède tous les droits sur toutes les ressources. Il est en général utilisé uniquement pour des tâches d'administration. Par souci d'une meilleure sécurité, certains systèmes UNIX permettent de mieux nuancer l'acquisition de droits supplémentaires par les utilisateurs. Ainsi Linux propose-t-il les « capacités » (capabilities) et Mac OS X permet d'installer des applications et d'intervenir sur la configuration du système au moyen d'un compte administrateur distinct de root (qui est d'ailleurs désactivé par défaut), en ce qu'il ne peut modifier les fichiers fondamentaux du système.

Au niveau matériel, le contrôle d'accès aux ressources se base d'une part sur des mécanismes inhérents aux principes de fonctionnement de la mémoire virtuelle, et d'autre part sur un modèle de protection à 2 niveaux : le mode superviseur (le plus privilégié, réservé au fonctionnement du noyau) et le mode utilisateur (le moins privilégié). Ce type de contrôle d'accès est possible sur la plupart des processeurs modernes supportant un UNIX. Certains processeurs fournissent des possibilités de protection plus étendues. Ainsi les processeurs de la famille Intel ix86 comportent 4 niveaux (ou anneaux) de protection. Des systèmes d'exploitation (peu nombreux à l'heure actuelle), tels que OS/2, exploitent cette possibilité.

[modifier] Sources de l'article

Certains passages de cet article, ou d'une version antérieure de cet article, sont basés sur l'article Introduction aux systèmes UNIX [1] du site Web Comment ça marche ? [2]. L'article d'origine porte la notice de copyright suivante : « © Copyright 2003 Jean-François Pillou - Hébergé par Web-solutions.fr. Ce document issu de CommentCaMarche.net est soumis à la licence GNU FDL. Vous pouvez copier, modifier des copies de cette page tant que cette note apparaît clairement. ».

Certains passages de cet article, ou d'une version antérieure de cet article, sont basés sur l'article FreeBSD ou sur une version antérieure de cet article. Pour la liste des auteurs, consulter l'historique de cet article.

[modifier] Notes

[modifier] Liens internes

[modifier] Liens externes (en français)

[modifier] Liens externes (en anglais)