Langues romanes

Un article de Wikipédia, l'encyclopédie libre.

Pour les articles homonymes, voir Roman.

On nomme langue romane[1] toute langue issue essentiellement du latin vulgaire (au sens étymologique de « populaire »), c'est-à-dire la forme de latin vernaculaire utilisée pour la communication de tous les jours, par opposition au latin classique et littéraire. Ce sont des langues indo-européennes basées sur le latin. Ces langues ont été parlées ou le sont encore dans un ensemble géographique désigné par le terme de Romania, désignant le Nord-Ouest européen de l'ancien Empire romain d'occident et l'Empire Romain d'Orient, resté debout, où les Valaques parlaient latin (mais où la langue grecque est rapidement devenue officielle en Europe et Anatolie, tandis que la Syrie, la Palestine et l'Egypte passèrent à l'arabe après la conquête musulmane). Les mots roman(e) et Romania remontent bien sûr à des dérivés de l'adjectif latin romanus : l'on considérait en effet que leurs locuteurs utilisaient une langue issue de celle des Romains, par opposition à d'autres introduites ultérieurement dans les territoires de l'Empire, comme le francique au nord de la France, langue des Francs appartenant à la famille des langues germaniques. La première attestation du terme de roman, sous une forme ou une autre, remonte au concile de Tours (813). C'est lors de ce concile – l'un des cinq réunis cette même année à l'initiative de Charlemagne – qu'une distinction est faite entre une langue de type roman et une langue germanique (qualifiée de tudesque). Il s'agit d'une forme de proto-français ou proto-occitan, nommée rustica romana lingua, ou encore roman. L'ancien français est donc la première langue romane attestée à l'écrit (ce qui ne signifie pas que ce soit la première langue à être apparue comme clairement différente du latin). Le premier ouvrage théorique sur les langues romanes est, en latin, le De Vulgari Eloquentia (« De l'éloquence vulgaire ») de Dante (XIIIe siècle), où apparaissent pour la première fois les dénominations de langue d'oïl, langue d'oc et de langue de si (pour l'italien et l'espagnol) — en fonction de la forme respective du mot oui dans les différentes langues romanes.

On date grosso modo l'évolution du latin vulgaire vers les langues romanes ainsi :

  1. entre -200 et 400 environ : différentes formes de latin vulgaire ;
  2. entre 500 et 600 : ces formes commencent à se différencier plus ou moins nettement ;
  3. En 813, au concile de Tours, l'existence de langues romanes est reconnue, puisque le concile demande que désormais les sermons soient prononcés en « rusticam Romanam linguam » (langue romane rurale) et non plus en latin afin d'être compris par tous.
  4. 842 : premier texte complet rédigé en une langue romane (le roman, forme de protofrançais), les Serments de Strasbourg.

Les langues romanes partagent un ensemble de traits communs donnant une bonne cohérence à cette famille de langues, parmi lesquels les plus importants sont :

Sommaire

[modifier] Liste des langues romanes

Les langues romanes sont classées en plusieurs groupes, chacun pouvant comprendre plusieurs « dialectes » ; il faut noter que le choix d'un de ces dialectes comme langue officielle est purement politique et, surtout, relativement récent dans de nombreux pays (sauf en France, par l'édit de Villers-Cotterêts). Quoi qu'il en soit, les langues romanes forment un continuum de langues entre lesquelles les différences sont parfois minimes ; il est toujours possible de distinguer au sein d'un ensemble ce que l'on nommera un ou plusieurs « dialectes ». La liste suivante présente entre parenthèses : nom dans la langue envisagée, date de la première attestation connue.

[modifier] Groupe gallo-roman

Pour connaître les détails de la composition de ce groupe, voir l'article gallo-roman.

  • 1. Langue(s) d'oïl (842 : peut-être les Serments de Strasbourg qui sont dans une langue romane composite). On trouve dans cette famille de nombreux dialectes appartenant au groupe des langues d'oïl. Une vision plus traditionnelle de la linguistique romane considère que le français (au sens large) et la langue d'oïl (au singulier) désignent une seule et même langue qui correspond principalement à un ensemble de traits d'oïl provenant de divers dialectes répartis historiquement autour de Paris (dans les faits, la langue française actuelle est très composite et doit beaucoup à une langue littéraire interrégionale). Une autre vision considère au contraire que les langues d'oïl (au pluriel) sont un groupe de langues et que le français (au sens restreint) n'est que l'une de ces langues (venue du francien), parmi d'autres.
Cet article ou cette section ne cite pas suffisamment ses sources. (date inconnue)
Son contenu est donc sujet à caution. Wikipédia doit être fondée sur des sources fiables et indépendantes. Améliorez cet article en liant les informations à des sources, au moyen de notes de bas de page (voir les recommandations).

[modifier] Groupe occitano-roman ou occitano-catalan

Ce groupe est intermédiaire entre le gallo-roman et l'ibéro-roman.

Géographie supra-dialectale de l'occitan.
Géographie supra-dialectale de l'occitan.
  • Occitan ou langue d'oc (occitan, lenga d'òc ; 842 : peut-être les Serments de Strasbourg qui sont dans une langue romane composite ; IXe siècle : traces de vulgarismes occitans dans des textes latins ; fin du Xe siècle : docs. juridiques ; 1102 : premier texte complet) : il s'agit d'un ensemble de dialectes constitué 1º du gascon, le plus spécifique des parlers du groupe, 2º du nord-occitan (limousin, auvergnat, vivaro-alpin) et 3º du sud-occitan (languedocien, provençal). Les parlers occitans sont souvent connus en France sous l'appellation dépréciative de « patois ».
Géographie supra-dialectale du catalan.
Géographie supra-dialectale du catalan.
  • Catalan (català ; fin du IXe siècle : traces de vulgarismes catalans dans des textes latins ; fin du XIIe siècle : premier texte complet dans un document juridique ; XIIIe siècle : sous l'égide de Ramon Llull, le catalan accède au statut de langue littéraire et de pensée reconnue) : l'une des langues officielles de la Catalogne (Espagne) ; il est parlé principalement dans cette Communauté autonome et dans une frange de l'Aragon, ainsi que dans celle méridionale de Valence (où il est aussi appelé valencien), ainsi qu'aux Îles Baléares, en Andorre (où il est la seule langue officielle), dans le Roussillon (France), connu en catalan sous le nom de Catalogne Nord (Catalunya Nord), ainsi que dans la ville de l'Alguer (en Sardaigne). La langue catalane fut spécialement réprimée sous le franquisme.

[modifier] Groupe ibéro-roman

  • L' Asturien (asturianu en asturien, connu sous les noms d'asturo-léonais, astur-léonais ou bable), est parlé aux Asturies, ainsi que dans certaines parties des provinces de León, Zamora et Salamanca (où on l'appelle le léonais ). Par le passé l'astur-léonais était la langue d'un territoire beaucoup plus important s'étendant au sud de la péninsule ibérique . Aux Asturies, bien que non reconnue comme langue co-officielle par le statut de la Principauté, elle est protégée par les textes de loi. Dans la région portugaise de Miranda do Douro on parle le mirandais, variante de l'asturien, et le mirandais possède le statut de seconde langue officielle du Portugal depuis 1999 pour la partie du territoire où elle est parlée..
  • Le Espagnol ou castillan (castellano, español) : langue officielle en Espagne et dans 21 pays d'Amérique latine[4].
  • Le Judéo-espagnol, issu du castillan parlé par les Juifs expulsés d'Espagne en 1492, demeure parlé par quelques dizaines de milliers (principalement en Israël, Turquie et sur le pourtour méditerranéen). Cette langue latine comprend des emprunts lexicaux à l'hébreu, au turc ainsi voire au grec, à l'italien ou à certains parlers slaves.
  • L' Aragonais (aragonés) est parlé dans certaines zones de l'Aragon, sans reconnaissance officielle. Le même terme est utilisé pour se référer au dialecte "castillanisant" parlé aussi dans cette région.
  • Le Galaïco-portugais est la langue mère écrite du portugais et du galicien. C'est la langue littéraire de toute la côte ouest de la Péninsule ibérique jusqu'au XIIe siècle et début du XIVe siècle, période au cours de laquelle le portugais s'est différencié du galicien.[5]. Langue de culture pendant sept siècles, y compris en dehors de la Galice et du Portugal ; ainsi le roi de Castille Alphonse X le sage aurait rédigé, ses Cantigas de Santa Maria dans cette langue. Langue de troubadours elle compte des poètes illustres, tel Martín Codax, Bernal de Bonaval, Arias Nunes etc.

[modifier] Groupe italo-roman

Italien (italiano ; Xe s. : documents juridiques, XIe s. : texte complet) ; très nombreux dialectes (plus de deux cents). On distingue deux groupes clairement différenciés, séparés par un grand faisceau d'isoglosses, la ligne Massa-Senigallia (dite de manière moins exacte "ligne La Spezia-Rimini"), qui correspond à la coupure des langues romanes en deux grands groupes: la Romania occidentale (incluant l'italien septentrional) et la Romania orientale (incluant l'italien centro-méridional et de l'extrème-sud)[7].

  • 2. Italien centro-méridional :
    • Toscan, regroupant plusieurs parlers communaux de Toscane[8]. Il intégre, par ailleurs, la langue corse et ses variantes.
    • Italien central, parlé dans les régions d'Ombrie, du Latium, des Marches et des Abruzzes. On distingue de nombreux idiomes suivant les régions : le laziale à Rome et ses alentours, le romanesco classique ainsi que le ciocaro de Frosinone dans la partie méridionale du Latium. L' ombrien (ou umbro) en Ombrie; le marchigiano englobant les parlers usités dans les Marches (notamment ceux d'Ancona, de Fabriano, de Macerata, de Fermo et de Camerino); l' abruzzais occidental et l' abruzzais adriatique parlé dans les Abruzzes.
    • Italien méridional, parlé dans les régions de Campanie, du Molise, des Pouilles, du Basilicate ainsi que dans le nord de la Calabre. L'italien méridional comprend le molisano qui est le parler du Molise.
      • Dialectes de type napolitain, comprenant le campanais (soit le napolitain de Naples et ses variantes suivant les contrées de Campanie : beneventano de Benevento, salernitano de Salerne), le calabrais septentrional (parlé dans le nord de la Calabre), ainsi que les deux variétés de lucan (ou lucanien), parlés dans le Basilicate ainsi que dans une partie de la province calabraise de Cosenza.
      • Les dialectes apuliens, employés dans la région des Pouilles et comprenant trois variantes : le foggiano, parlé dans la province de Foggia; le barese, usité dans les provinces de Bari, de Brindisi et dans les contrées orientales du Basilicate; ainsi que le tarentin, parlé dans la ville de Tarente et ses proches alentours.
  • 3. Italien de l'extrème-sud :
    • Sicilien de Sicile, ancré sur l'île aux trois pointes et divisé en une multitude de dialectes et de sous-dialectes régionaux voire communaux. Pour exemple, le parler d'Agrigente est un sous-dialecte du sicilien occidental qui est un dialecte du sicilien de Sicile.
    • Calabrais centro-méridional, parlé en Calabre citérieure et lui aussi divisé en plusieurs dialectes.
    • Salentin est usité dans le Salento, dans le sud des Pouilles. Les dialectes apuliens à transition salentine sont parlés, quant à eux, dans les parties méridionales des provinces de Brindisi et de Tarente.


Mais cette dialectologie est sommaire et ne décrit pas avec précision l'extraordinaire diversité, largement conservée, des parlers italiens proprement dits.

[modifier] Groupe sarde

La carte des langues de Sardaigne.
La carte des langues de Sardaigne.

Sarde (sardu, limba sarda ; XIe s.) : parlé en Sardaigne ; c'est une des langues romanes des plus conservatrices, ce que l'on explique par son statut au sein d'un lieu isolé[9] ; il a néanmoins connu de nombreuses influences, parmi lesquelles le catalan, le castillan puis l'italien sont les plus importantes ; on distingue plusieurs dialectes, dont les principaux sont[10] :

  • campidanien (région de Cagliari),
  • logoudorien (Logudoro), qui constitue la langue considérée classique, dont la variété du nuorais (Nuoro) ; ces deux derniers dialectes sont plus archaïsants que le premier.
  • une tentative de normalisation d'une langue sarde unifiée (LSU) est appuyée par la région autonome.

[modifier] Groupe rhéto-roman (XIIe s.)

Ce groupe est intermédiaire entre l'italo-roman et le gallo-roman (à l'instar de l'italien septentrional).

  • Romanche (rumantsch) : le sursilvan (haute vallée du Rhin), le sutsilvan et le surmiran (centre du canton des Grisons), le puter et le vallader (Engadine) forment les cinq dialectes écrits ; ils sont parlés en Suisse (dans les Grisons) par environ 45 000 personnes. Le premier texte en puter a été écrit en 1527 à Zuoz (La chanzun da la guerra dal chasté da Müsch), le premier en vallader en 1560 à Susch. L'interromanche (rumantsch grischun) est la variété standard du romanche utilisée en Suisse pour unifier les cinq groupes dialectaux ; il s'appuie en grande partie sur le sursilvan, le vallader et le surmiran ; l'interromanche est une langue officielle en Suisse dans le canton des Grisons.
  • Ladin (ladin) : utilisé dans les Dolomites italiennes.
  • Frioulan (furlan) : parlé dans la province italienne d'Udine ; frioulan et ladin n'ont qu'un statut de langue régionale.

Certains linguistes, minoritaires, y rattachent l'Istrien ou Istro-roumain. Toutes ces langues, morcelées entre de multiples dialectes, sont en régression constante.

[modifier] Groupe istro-dalmate

Ce groupe également dit illyro-roman est parfois compté dans le groupe des langues romanes orientales. Il présente des caractères intermédiaires entre le groupe rhéto-roman et le groupe roman oriental.

Connu au Moyen Âge (fin XIIIe s.) sous les noms de mavro-valaque ou morlaque, attesté directement vers 1840, le Dalmate est éteint. Parlé autrefois dans les îles et les régions côtières de la Croatie et du Monténégro, il comprenait trois dialectes recensés : l'Istrien ou Istro-roumain, parlé en Istrie (dont le dernier locuteur s'est éteint en 2006), le végliote (veklisuṅ, au nord , dans l'île de Krk ou Veglia), dont le dernier locuteur s'est éteint en 1898) et le ragusain (au sud, dans l'actuelle Dubrovnik, éteint dès le XVe siècle).

[modifier] Groupe des langues romanes orientales

Le groupe istro-dalmate lui est parfois intégré.

Ce groupe comprend deux langues vivantes et deux éteintes :

  • le daco-roumain nommé officiellement Roumain en Roumanie (română, limba română) et Moldave en Moldavie (limba moldovenească); partiellement attesté au XIIe s., complètement attesté au XVe s., c'est la langue de l'ancienne province romaine de Dacie coupée du reste de la Romania ; les superstrates slave et turc restent d'importance faible et le roumain s'avère assez conservateur ; c'est en cela qu'il est relativement différent des autres langues romanes et dyssimétrique par rapport à elles (il est beaucoup plus facile à un roumanophone de comprendre l'italien ou le français, que l'inverse); il est langue co-officielle en Voïvodine serbe, mais est également parlé en Serbie (Portes de Fer et vallée du Timoc). Des minorités roumanophones vivent également en Ukraine, et une importante diaspora vit depuis les années 2000-2005 en Espagne et en Italie.
  • le Mégléno-roumain (ou mégléniote), jadis parlé en Macédoine et en Turquie.
  • l'aroumain (appelé macédo-roumain en Roumanie), parlé principalement en Grèce septentrionale, en Albanie, Serbie, Macédoine et Roumanie.

Certains linguistes roumains incluent également l'Istro-roumain et le Dalmate dans ce groupe.

[modifier] Du latin classique au latin vulgaire

[modifier] Quelques modifications phonétiques propres au latin vulgaire

Note : les transcriptions phonétiques sont en alphabet phonétique international.

À propos du latin vulgaire, il convient de noter que les Romains, comme les Grecs, vivaient en situation de diglossie : la langue de tous les jours n'était pas le latin classique (celui des textes littéraires ou sermo urbanus: "langue de la ville", c'est-à-dire "puriste", figé par la grammaire comme l'a été le sanskrit), mais une forme distincte bien que très proche, au développement plus libre (le sermo plebeius, "langue vulgaire"). Il semble acquis que le latin classique ne se limitait pas à un emploi livresque, mais qu'il était couramment parlé par les catégories sociales élevées, bien que celles-ci aient trouvé plus raffiné encore de s'exprimer en grec (et il semble que César n'ait pas dit à Brutus "Tu quoque, fili" mais "Kai si, tecne"), tandis que le sermo plebeius était la langue des soldats, des commerçants, du petit peuple ; n'ayant jamais accédé au statut de langue littéraire, le latin vulgaire nous est surtout connu par la phonétique historique, des citations et des critiques prononcées par les tenants d'un latin littéraire ainsi que de nombreuses inscriptions, des registres, comptes et autres textes courants. D'autre part, le Satyricon de Pétrone, sorte de "roman" écrit vraisemblablement au premier siècle de l'ère chrétienne et se passant dans les milieux interlopes de la société romaine, est un témoignage important de cette diglossie : selon leur catégorie sociale, les personnages s'y expriment dans une langue plus ou moins proche de l'archétype classique.

Parmi les textes qui ont blâmé les formes jugées décadentes et fautives, il faut retenir l'Appendix Probi (voir ce document), sorte de compilation d'« erreurs » fréquentes relevées par un certain Probus et datant du IIIe siècle de l'ère chrétienne. Ce sont bien ces formes, et non leur équivalent en latin classique, qui sont à l'origine des mots utilisés dans les langues romanes. Voici quelques exemples de « fautes » citées par Probus (selon le modèle : A non B, « [dites] A et non B »), classées ici par type d'évolution phonétique et assorties de commentaires permettant de signaler les principales différences phonologiques entre le latin classique et le latin vulgaire ; il n'est bien sûr pas possible d'être exhaustif en la matière et de référencer toutes les différences entre le latin classique et le latin vulgaire, mais l'Appendix Probi peut constituer une introduction pertinente sur le sujet :

1. calida non calda, masculus non masclus, tabula non tabla, oculus non oclus, etc.
Ces exemples montrent l'amuïssement des voyelles post-toniques (et aussi pré-toniques) brèves ; les mots latins sont en effet accentués cálida, másculus, tábula et óculus, la voyelle suivante étant brève. Cet amuïssement prouve aussi que l'accent de hauteur du latin classique est devenu un accent d'intensité en latin vulgaire (en effet, un accent de hauteur n'a pas d'influence sur les voyelles atones environnantes). L'on reconnaît dans cette liste les ancêtres de chaude (ancien français chalt), mâle (ancien français masle), table et œil ; ce processus a donné naissance à des transformations importantes des consonnes entrées en contact après la chute de la voyelle les séparant : ainsi, un /l/ devant consonne est passé à /l/ vélaire (soit /ɫ/) puis à /u/ en français (vocalisation), d'où chaud ; de même, /kl/ a pu donner un /l/ palatalisé (voir au point 2) ;
2. vinea non vinia, solea non solia, lancea non lancia, etc.
L'on voit là le passage en latin vulgaire de /e/ bref devant voyelle à /j/ (son initial de yacht ; le phénomène est nommé consonification) qui, après consonne, la palatalise ; ces consonnes palatalisées (qui peuvent provenir d'autres sources), sont importantes dans l'évolution des langues romanes. Cette transformation explique pourquoi l'on obtient, par exemple, vigne (avec /nj/ devenant /ɲ/, noté dans les langues romanes par le digramme gn en français et italien, ñ en castillan, ny en catalan, nh en portugais et occitan, etc.), seuil (avec anciennement un /l/ palatal, soit /ʎ/, noté par ill / il en français, devenu ensuite un simple /j/, conservé en castillan, où il est noté ll, double l [sauf quand il provient de /lj/, où il passe à /x/, phonème dit jota, comme en catalan, en portugais et occitan, écrit lh, etc.), et lance (avec le son /s/ issu de /ts/, forme palatalisée de /k/, que notait bien la lettre c latine ; de même en castillan lanza /lanθa/, anciennement lança /lantsa/, ou en roumain lance /lanʧe/, etc.) ;
3. auris non oricla.
Probus note dans cet exemple plusieurs phénomènes : premièrement la réduction des anciennes diphtongues (ici /au/ devenant /ɔ/, soit /o/ ouvert ; l'on a aussi en latin vulgaire /ae/ donnant /ɛ/, /e/ ouvert, ainsi que /oe/ passant à /e/, /e/ fermé), puis l'utilisation d'une forme de diminutif au lieu de la forme simple (auris : « oreille », auricula : « petite oreille »). L'utilisation des diminutifs en latin vulgaire est fréquente : ainsi soleil vient de solic(u)lu(m) et non de sol, ou encore genou de genuc(u)lu(m) et non de genu. Enfin, on note l'amuïssement du /u/ bref devant voyelle accentuée : on attendrait oricula. Comme on l'a dit en 1, la rencontre de c et l, /kl/, causée par la chute de la voyelle les séparant, donne naissance à une nouvelle consonne, ici un /l/ palatal, conservé en catalan dans orella, devenu /j/ en français mais /x/ en castillan, dans oreja /ɔrexa/) ;
4. auctor non autor.
On remarque aussi des réductions de groupes de consonnes ; ainsi, /kt/ passe à /t/, donnant en français auteur, ou autor en castillan et catalan ; de même, /pt/ passe à /t/. C'est le cas dans dom(i)tare devenu domtar puis domptar et enfin dontar. L'insertion d'un /p/ entre /m/ et une occlusive est normale : on parle d'une épenthèse, donnant en français dompter que l'on prononçait /dõte/ avant que l'orthographe n'influence la prononciation, devenant parfois /dõpte/. Autre simplification : /pt/ donne /t/, comme dans comp(u)tare devenu comptare puis compter et conter /kõte/ en français, contar en castillan, etc.
5. rivus non rius, sibilus non sifilus.
Le son /w/ du latin, noté par la lettre u (ou v dans les éditions modernes) a évolué de manières diverses, soit en s'amuïssant entre voyelles (ri(v)us donnant rio en castillan, pa(v)or donnant peur, italien paura), en devenant une spirante bilabiale sonore (/β̞/, en castillan et catalan) puis se renforçant en /v/ (dans la majorité des langues romanes) ; /p/ et /b/ entre voyelles connaissent le même sort, ce qui explique que sibilus donne sifilus, sachant que /f/ n'est que la variante sourde de /v/ ; ainsi explique-t-on siffler (de sibilare, devenant sifilare puis siflare) ou savoir (de sapere, puis sabere, savere ; le castillan saber montre, par son orthographe, qu'il en est resté au stade /β̞/), etc.
6. pridem non pride.
Dernier exemple (la liste n'est bien sûr pas exhaustive, loin de là) montrant que le /m/ en fin de mots n'est plus prononcé (ce qui est déjà le cas en latin classique : la scansion du vers latin le prouve facilement). Cet amuïssement est, entre autres, à l'origine de la disparition du mécanisme des flexions : les langues romanes, en effet, n'utilisent plus la déclinaison.

Cette liste n'est bien sûr pas exhaustive ; il faudrait aussi aborder la question de la diphtongaison « pan-romane » (que toutes les langues romanes ont connue) et signaler que nombre de voyelles ont subi par la suite des diphtongaisons secondaires.

[modifier] Transformations en profondeur du système morpho-syntaxique

[modifier] Système nominal

La chute du /m/ final, consonne que l'on rencontre souvent dans la flexion, crée donc une ambiguïté : Romam se prononçant comme Roma, l'on ne peut savoir si le mot est au nominatif, à l'accusatif ou à l'ablatif. Ainsi, les langues romanes ont dû utiliser des prépositions pour lever l'ambiguïté. Plutôt que dire Roma sum (classique Romæ sum avec un locatif que n'a pas gardé le latin vulgaire) pour « je suis à Rome » ou Roma(m) eo pour je vais à Rome, il a fallu exprimer ces deux phrases par sum in Roma et eo ad Roma. À cet égard, il convient de rappeler que si en latin classique déjà, dès l'époque impériale, le /m/ en fin de mots s'amuïssait, Roma sum et Roma(m) eo ne pouvaient être confondus : à l'ablatif (Roma sum), le /a/ final est long ; il est cependant bref à l'accusatif : ainsi l'on prononçait /rōmā/ pour le premier, /rōmă/ pour le second. Le latin vulgaire, toutefois, n'utilise plus le système de quantité vocalique : les deux formes sont d'autant plus ambiguës.

Dans un même mouvement, les adverbes et les prépositions simples sont parfois renforcées : ante, « avant », ne suffit plus ; il faut remonter à ab + ante en vulgaire pour expliquer le français avant, le castillan antes et l'occitan avans, ou bien in ante pour le roumain înainte, etc. ; de même avec provient de apud + hoc, dans de de intus, etc. Le cas limite semble être atteint avec le français aujourd'hui, notion qui se disait simplement hodie en latin classique. Le terme français s'analyse en à + le + jour + de + hui, où hui vient de hodie (qui a donné hoy en castillan, oggi en italien, uèi en occitan, hoz en romanche, oûy en wallon, etc.). Le composé agglutiné résultant est donc redondant, puisqu'il signifie mot à mot : « au jour d'aujourd'hui » (qu'on trouve en français familier). Certaines langues conservatrices ont cependant gardé des adverbes et prépositions simples : le castillan et l'italien con, « avec », et le roumain cu viennent bien de cum, de même que en castillan ou în roumain sont hérités de in. L'on voit aussi ce phénomène avec les mots simples hérités de hodie.

De langue flexionnelle à la syntaxe souple (l'ordre des mots ne comptant pas énormément pour le sens mais principalement pour le style et l'emphase), le latin vulgaire est devenu un ensemble de langues utilisant nombre de prépositions, dans lesquelles l'ordre des mots est fixe : s'il est possible de dire en latin Petrus Paulum amat ou amat Petrus Paulum ou Paulum Petrus amat ou encore amat Paulum Petrus pour signifier que « Pierre aime Paul », ce n'est plus possible dans les langues romanes, qui ont plus ou moins rapidement abandonné les déclinaisons ; ainsi, en castillan Pedro ama a Pablo et Pablo ama a Pedro ont un sens opposé, seul l'ordre des mots indiquant qui est sujet et qui est objet. Lorsque les langues romanes ont gardé un système de déclinaisons, celui-ci est simplifié et se limite à quelques cas (à l'exception du roumain) : c'est ce qui arrive en ancien français, qui n'en possède que deux, le cas sujet (hérité du nominatif) et le cas régime (venant de l'accusatif), pour tout ce qui n'est pas sujet. En français, toujours, le cas sujet a disparu ; les noms actuels hérités de l'ancien français sont donc presque tous d'anciens cas régime (il y a quelques exceptions, comme ancêtre, peintre, traître, anciens cas sujet, et chandeleur, provenant d'un génitif pluriel latin candelorum) et, partant, d'anciens accusatifs ; on peut le constater avec un exemple simple :

Latin classique Ancien français Français
singulier pluriel singulier pluriel singulier pluriel
nominatif murus muri cas sujet murs mur - -
accusatif murum muros cas régime mur murs mur murs

Le roumain, toutefois, conserve un système flexionnel fonctionnant avec trois cas syncrétiques : cas direct (nominatif + accusatif), cas oblique (génitif + datif) et vocatif. Ces cas se distinguent principalement si le nom est marqué par l'article défini. Dans le cas contraire, ils ont tendance à être confondus.

D'autres points méritent d'être signalés : tout d'abord, encore à l'exclusion du roumain, les trois genres, masculin, féminin et neutre, sont réduits à deux par l'élimination du neutre ; ainsi, le mot latin folia, nominatif / accusatif neutre pluriel de folium, « feuille », est réinterprété comme un féminin : c'est le cas, par exemple, en français, où il devient feuille, mais aussi en castillan, sous la forme hoja, en italien foglia, romanche föglia, wallon fouye, portugais folha, catalan fulla, occitan fuèlha, etc., tous mots féminins. De plus, les langues romanes ont développé un système d'articles définis, inconnus du latin classique. Ainsi, en français, le et la proviennent respectivement des pronoms / adjectifs démonstratifs ille et illa ; de même en castillan pour el et la (plus un neutre lo < illud), en italien pour il et la (ainsi que lo, neutre, < illud), etc. Le roumain se distingue en étant la seule langue romane dans laquelle l'article est enclitique : om, « un homme », om-ul, « l'homme ». Les articles indéfinis, pour leur part, proviennent simplement du numéral unus, una (et unum au neutre), qui, en latin, aurait pu servir à cet usage.

Enfin, le système de l'adjectif est revu : alors que les degrés de l'adjectif étaient marqués par des suffixes, les langues romanes ne se servent plus que d'un adverbe devant l'adjectif simple, magis (devenant más en castillan, mai en occitan et en roumain, mais en portugais, més en catalan, etc.) ou plus (più en italien, plus en français et en occitan, pus en wallon et en catalan ancien ou dialectal, plu en romanche, etc.) : ainsi, pour dire plus clair (comparatif de supériorité) en latin classique, clarior suffisait (dérivé de clarus) ; on dit en castillan más claro, en italien più chiaro, en occitan plus clar ou mai clar, etc. De même, le superlatif le plus clair se disait clarissimus en latin classique, mais el más claro en castillan et il più chiaro en italien. On trouve cependant quelques archaïsmes : le portugais a conservé des mots différents pour le plus grand, o maior, et le plus petit, o menor, comme le castillan avec mayor et menor, comparables, bien que d'emploi très différent, aux majeur et mineur du français.

[modifier] Système verbal

En outre, les conjugaisons sont profondément modifiées, notamment par la création de temps composés : ainsi notre j'ai chanté, castillan he cantado ou encore catalan he cantat, occitan ai cantat, roumain am cântat, viennent d'un habeo cantatu(m) vulgaire, qui n'existe pas en classique. L'utilisation de verbes auxiliaires, être et avoir, est notable : le latin utilisait déjà, d'une manière différente, être dans sa conjugaison, mais pas d'une manière aussi systématique que dans les langues romanes, qui ont généralisé leur emploi afin de créer un jeu complet de formes composées répondant aux formes simples. Généralement, les formes composées marquent l'aspect accompli.

Un mode nouveau apparaît, le conditionnel (attesté pour la première fois dans une langue romane dans la Séquence de sainte Eulalie), construit à partir de l'infinitif (parfois modifié) suivi des désinences d'imparfait : vivr(e) + -ais donne vivrais en français, et, mutatis mutandis , viviría en castillan, viuria en catalan, viuriá en occitan. Certaines modifications du radical sont à noter : devoir + ais > devrais et non *devoirais, ou bien haber + ía > habría et non *habería. De la même manière, le futur classique est abandonné au profit d'une formation comparable à celle du conditionnel, c'est-à-dire l'infinitif suivi du verbe avoir (ou précédé en sarde) : ainsi cantare habeo (« j'ai à chanter ») donne chanterai, castillan cantaré, catalan cantaré, occitan cantarai, etc.

Le passif est évacué au profit du système composé qui préexistait en latin (cantatur, « il est chanté », classique devient le vulgaire est cantatus, qui, en classique signifiait « il a été chanté »). Enfin, certaines conjugaisons irrégulières (comme celle de volle, « vouloir ») sont rectifiées (mais restent souvent irrégulières dans les langues romanes) et les verbes déponents cessent d'être utilisés.

[modifier] Le lexique du latin vulgaire

Le latin vulgaire et le latin classique ne diffèrent pas seulement par des aspects phonologiques et phonétiques, mais aussi par le lexique ; les langues romanes, en effet, n'utilisent que dans des proportions variables le vocabulaire classique. Souvent, des termes populaires ont été retenus, évinçant ceux propres à la langue plus soutenue.

Certains termes latins ont disparu et ont été remplacés par leur équivalent populaire ; c'est le cas de celui qui désigne le cheval, equus en latin classique, mais caballus (« canasson » ; le mot est peut-être d'origine gauloise) en latin vulgaire, que l'on retrouve dans toutes les langues romanes : caballo en castillan, cavall en catalan, caval en occitan, cheval en français, cal en roumain, cavallo en italien, dj'vå en wallon, chavagl en romanche, etc. Mais on notera que la jument est appelée yegua en castillan, égua en portugais, egua en catalan et èga en occitan, du latin equa (l'occitan emploie aussi cavala).

D'autre part, certains termes classiques disparus n'ont pas forcément été remplacés par le même mot vulgaire dans toute la Romania : le terme soutenu pour « parler » est loqui en latin classique, gardé en roumain (a locui), remplacé par :

  • parabolare (terme emprunté à la liturgie chrétienne et d'origine grecque ; proprement : « parler par parabole ») : français parler, italien parlare, catalan et occitan parlar, etc. ;
  • fabulare (proprement : « affabuler ») : castillan hablar, portugais falar, sarde faedhàre, etc.

Enfin, certaines langues romanes continuent d'utiliser la forme classique, tandis que d'autres, que l'on dit moins « conservatrices », se servent d'une forme vulgaire ; l'exemple donné traditionnellement est celui du verbe « manger » :

  • latin classique edere : se retrouve (sous une forme composée ; cette forme est cependant sentie moins « noble » que le classique puriste edere) en castillan et portugais comer (de comedere) ;
  • latin vulgaire manducare (proprement « mâcher ») : français manger, italien mangiare, catalan menjar, occitan manjar, ou encore roumain mânca, par exemple.

[modifier] Les raisons de la diversité des langues romanes

Géographie des langues romanes en Europe
Géographie des langues romanes en Europe

L'évolution phonétique naturelle des langues, à laquelle le latin n'a bien sûr pas échappé, explique en grande partie les différences importantes entre certaines des langues romanes. À ce processus s'est aussi ajouté la non-unicité lexicale de ce que l'on désigne sous le terme de latin vulgaire : la taille de l'Empire romain et l'absence d'une norme littéraire et grammaticale ont permis à cette langue vernaculaire de ne pas être figée. Ainsi, chaque zone de la Romania a utilisé une saveur particulière du latin vulgaire (il vaudrait même mieux dire « des latins vulgaires »), comme on l'a vu plus haut, telle langue préférant tel terme pour signifier « maison » (latin casa en castillan, catalan, italien, portugais, roumain), telle autre un terme différent (mansio pour le même sens en français), par exemple.

S'est greffée à ces deux données la présence de substrats, langues parlées initialement dans une zone et recouvertes par une autre, ne laissant que des traces éparses, tant lexicales ou grammaticales que phonologiques, dans la langue d'arrivée. Ainsi, le substrat gaulois en français lui laisse quelque cent quatre-vingts mots comme braies, char ou bec, et serait à l'origine du passage du /u/ (de loup) latin à /y/ (de lune). Cette hypothèse ne fait cependant pas l'unanimité. Bien entendu, l'influence du gaulois ne s'est pas limitée à la langue française : les dialectes de l'Italie du Nord, par exemple, en possèdent quelques termes, et on a ainsi en italien standard braghe pour braies (qui a donné plus tard les mots français braguette et bretelle), carro pour char, ou becco pour bec. De même le basque pour les langues ibérico-romanes (où le mot pour « gauche », soit sinistra en latin classique, est remplacé par des dérivés du basque ezker, soient esquerra en catalan, izquierda en castillan et esquerdo en portugais), ou encore l'étrusque pour le dialecte italien de Toscane, qui lui devrait, même si c'est fort improbable, sa gorgia toscana, c'est-à-dire la prononciation des /k/ comme des /h/ (anglais home) ou des /χ/ (allemand Bach). Il faut noter que cette influence de l'étrusque sur le toscan est de nos jours considérée comme un mythe sans fondements réels : en effet, le phénomène n'est pas limité à la Toscane, il n'est pas présent dans toutes les zones à dominante linguistique toscane (la Corse, par exemple qui ─ bien qu'éloignée ─ a été fortement toscanisée), il n'est pas attesté avant le XVIe siècle et il ne correspond pas réellement à des caractéristiques phonétiques étrusques. Enfin et surtout, on voit mal comment une langue morte bien avant l'apparition des dialectes italiens aurait pu transmettre cet unique trait sans avoir laissé ni vocabulaire ni même coutumes.

Enfin, les superstrats ont aussi joué un rôle prépondérant dans la différenciation des langues romanes : ce sont les langues de peuples s'étant installés dans un territoire sans réussir à imposer leur langue. Celle-ci a cependant laissé des traces importantes. Le superstrat francique (donc germanique) en France est important ; le vocabulaire médiéval en est émaillé, surtout dans le domaine de la guerre et de la vie rurale (ainsi heaume, adouber, flèche, hache, etc., mais aussi framboise, blé, saule, etc., ou encore garder et, plus surprenant, trop), et le français actuel compte plusieurs centaines de mots ainsi hérités du francique. C'est un superstrat arabe que l'on remarque le plus en castillan et en portuguais : plus de quatre mille termes, parmi lesquels des toponymes et des composés, viennent de cette langue. Le trait le plus remarquable est le maintien quasi systématique de l'article arabe dans le mot, alors que les autres langues romanes ayant aussi emprunté le même terme s'en sont souvent débarrassées : ainsi les gloses espagnoles algodón (contre français coton), de l'arabe أَلْقُطْن, ʾal-quṭn, algarroba (français caroube), de ʾal-harūbah ou encore aduana (français douane), de أَلدِّيوَان, ʾad-dīwān (qui donne aussi divan). Enfin, dernier superstrat remarquable, le slave, dont l'influence en roumain est notable. Le roumain devrait aux langues slaves alentour son vocatif, quelques termes du lexique ainsi que des processus de palatalisation différents de ceux des autres langues romanes.

L'influence des langues romanes les unes sur les autres, d'autre part, est considérable. A tel point qu'un courant du mouvement interlingua, dit "latin moderne", préconise d'utiliser dès à présent cette langue comprise sans étude (50 mots à apprendre sur un vocabulaire basique de 5 000) par tous les locuteurs romans (qui sont environ 900 millions dans le monde), après remplacement des mots antiques sans postérité gardés à tort par l'interlingua, modernisation de ses formes lexicales et phonétisation de son orthographe. (Voir langmaker.com/db/Modern_latin)

L'on peut donner ici les résultats d'une étude menée par M. Pei en 1949, qui a comparé le degré d'évolution de diverses langues par rapport à leur langue-mère ; pour les langues romanes les plus importantes, si l'on ne considère que les voyelles toniques, l'on obtient, par rapport au latin, les coefficients d'évolution suivants :

  • sarde : 8 % ;
  • italien : 12 % ;
  • castillan : 20 % ;
  • roumain : 23,5 % ;
  • occitan : 25 % ;
  • portugais : 31 % ;
  • français : 44 %.

L'on voit ainsi facilement le degré variable de conservatisme des langues romanes, la plus proche du latin phonétiquement (en ne considérant que les voyelles toniques) étant le sarde, la plus éloignée le français.

[modifier] Diffusion mondiale de certaines langues romanes

Diffusion mondiale des langues romanes  Français   Espagnol   Portugais   Italien   Roumain 
Diffusion mondiale des langues romanes
 Français   Espagnol   Portugais   Italien   Roumain 

Du fait de la colonisation, l'aire géographique des locuteurs de langues romanes s'étend largement au-delà de l'Europe. Les plus largement diffusées sont l'espagnol (Mexique, Amérique centrale et Amérique du Sud, Philippines, etc.), le portugais (Brésil, Angola, Mozambique, etc.) et le français (Canada, Afrique, etc.).

Le castillan et le français sont comptés parmi les langues officielles de l'ONU.

[modifier] Annexes

[modifier] Bibliographie

  • Jean-Marie Klinkenberg, Des langues romanes, éditions Duculot, Louvain-la-Neuve, 1994 (2e édition) ;
  • Pierre Bec, Manuel pratique de philologie romane, Paris, 1970-1971, deux tomes ;
  • Mireille Huchon, Histoire de la langue française, Paris, 2002 ;
  • Édouard Bourciez, Éléments de linguistique romane, Paris, 1967 pour la 5e édition ;
  • Max Niedermann, Phonétique historique du latin, Paris, 1953 pour la 3e édition ;
  • Paul Teyssier, Comprendre les langues romanes, du français à l'espagnol, au portugais, à l'italien & au roumain, méthode d'intercompréhension, Paris, Chandeigne, 2004 ;
  • M.-D. Glessgen, Domaines et Méthodes de la linguistique romane, Zürich, 2004-2005, RoSe, 2vol. ;
  • M. Banniard, Du latin aux langues romanes, 1997, Nathan ;
  • Yves Cortez, Le français ne vient pas du latin, Paris, 2007, Editions L'harmattan.

[modifier] Liens internes

[modifier] Liens externes

[modifier] Notes

  1. C’est à l’utilisation par Charles de Gerville, dans une lettre adressée à son ami Arcisse de Caumont en 1818, du terme de « roman », pour qualifier ces langues qu’on doit le genèse de cette expression.
  2. Délégation générale à la langue française et aux langues de France - Pprésentation
  3. Délégation générale à la langue française et aux langues de France - Pprésentation
  4. référence, Henriette Walter, L'Aventure des langues en occident, Editions Robert Laffont, S.A. 1994 ISBN 2-221-05918-2
  5. référence, Henriette Walter, L'Aventure des langues en occident, Editions Robert Laffont, S.A. 1994 ISBN 2-221-05918-2, pages 206 à 208
  6. référence, Henriette Walter, L'Aventure des langues en occident, Editions Robert Laffont, S.A. 1994 ISBN 2-221-05918-2
  7. Pellegrini G. B, Carte des dialectes d'Italie, édition Pacini, Pisa, 1977.
  8. Pour exemples : le florentin, le siennois ou le lucquois; respectivement parlés à Florence et le long du fleuve Arno (jusqu'à Fucecchio), à Sienne et dans sa province, et dans la Lucchesia (Lucques et ses alentours).
  9. Eduardo Blasco Ferrer, Linguistica sarda : Storia, metodi, problemi, édition Condaghes, 2003.
  10. Francesco Mameli, Il logudorese e il gallurese, Villanova Monteleone (SS): Soter, 1998.