le legs de la langue arabe au lexique français

Contribution à la Journée d’étude organisée sur le thème Enseignement, Langue et Culture arabes en France : réalités et perspectives, le 3 avril 2010, au Palais du Luxembourg (Sénat), Paris, par le CCMF, Gnôsis et SELEFA.

par Roland LAFFITTE

Si l’on prend comme témoin le Petit Robert, près de 425 entrées sur les 35.000 présentées sont recensées comme d’origine arabe, soit à peu près 1,5 %. Et nous avons un rapport semblable dans les autres dictionnaires représentatifs de la langue commune.

Un tel lot comprend deux sortes de termes :

Des mots créés par la langue arabe et qui constituent la grande majorité. C’est le cas d’algèbre,amiral,mosquée ou zénith, etc.
Des mots seulement transmis et non créés par la langue arabe bien que celle-ci en ait parfois généralisé ou spécialisé l’acception par rapport à celle de l’étymon, c’est-à-dire au terme premier attesté ou reconstitué, comme il advient souvent avec les emprunts linguistiques. Et nous sommes ici en présence d’un grand éventail d’origines possibles. Nous avons en effet des mots mésopotamiens (sumériens, akkadiens ou autres) généralement transmis par l’araméen commecumin,sésame ou mesquin ; ou directement des termes araméens, notamment syriaques comme médina ou sultan. On relève également des mots sanscrits pris directement par l’arabe ou plus généralement par l’intermédiaire d’une langue iranienne, comme limon, orange ou sucre ; ou des termes directement issus du persan comme divan, lascar ou risque. Il faut compter encore des mots chinois, souvent par l’intermédiaire d’autres langues, comme galanga ou satin, ou issus de l’égyptien comme de langues africaines comme girafe. Et cela sans parler d’un certain nombre de termes venant du grec comme alambic, dirham ou flous, termes parmi lesquels cette langue a servi d’intermédiaire du latin comme c’est le cas d’abricot.

Les dictionnaires n’opèrent en général pas de distinction nette entre emprunts directs et emprunts indirects.

Pour ce qui est des emprunts directs à la langue arabe, on en relève un certain nombre au Moyen-Âge, qu’ils soient venus par le canal des relations commerciales nouées par les États francs du Levant, l’Andalousie ou la Sicile : c’est le cas de mamelouk, tambour ou truchement. Une bonne partie est due à des voyageurs qui ont visité les pays du Maghreb et surtout les États du Moyen-Orient ‒ Perse et Empire ottoman ‒, essentiellement de la fin du XV^e siècle à celle du XVIII^e : parmi ces termes, entrés dans la langue comme « termes de relation » comme on disait à l’époque de l’Encyclopédie et que Raymond Arveiller a nommés « termes de voyage », on note par exemple burnous, jasmin ou muse ‒ qui est le nom ancien de la « banane ». C’est surtout à l’époque coloniale, dont le coup d’envoi fut donné par l’expédition de Bonaparte en Égypte et qui fut clôturée par la victoire de la Révolution algérienne en 1962, qu’entrent dans la langue française nombre de mots du domaine administratif, civil et militaire comme goum, maghzen ou zouave ; du sabir militaire comme barda, gourbi ou matraque ; ou encore de la langue des colons comme chicaya, merguez ou souk. Et n’oublions pas les emprunts contemporains arrivés dans la langue commune par au moins trois filons distincts : celui de l’actualité internationale comme ayatollah, intifada ou naqba, celui du développement de la religion musulmane en Europe, comme charia, hijab ou imam, et celui de la langue des jeunes, comme beur, kif ou wech.

Ces emprunts directs sont en général parfaitement repérables à la différence des emprunts indirects, c’est-à-dire des mots introduits dans la langue française par le truchement d’autres langues et dont l’empreinte arabe peut ne pas être reconnue pour diverses raisons.

C’est ainsi que l’étymologie des termes antiques s’arrête en général à l’étape grecque de la remontée dans l’histoire : le mot arabe par exemple est vu comme venant du latin arabus, lui-même du grec araps, mais le Petit Robert ne cherche pas plus loin, alors que tout le monde peut comprendre aisément que les Grecs ont bien pris ce mot quelque part… Il en est de même de balsame et beaume que ce dictionnaire fait venir du grec balsamon, et de chameau présenté comme issu du grec kamelos sans voir que le grec lui-même ne les a pas inventés puisqu’ils s’appliquent respectivement à une plante et à un animal dont la culture ou la domestication se sont effectuées en Arabie méridionale.

Plus près de nous, de nombreux termes sont venus de l’arabe par une langue romane, l’espagnol, le portugais ou le catalan, les langues d’Italie ou l’occitan sans que l’on indique toujours les termes originels : on présente bien ainsi le mot alcôve comme issu de l’arabe par l’espagnol mais on bute sur le mot adobe qui n’est pas indiqué comme étant lui-même l’arabe al-tûb. Parallèlement artichaut est à juste titre donné comme venant de l’arabe par l’italien mais on se perd sur l’origine de coupole qui nous arrive pourtant de façon assez probable de Palerme où plusieurs élégants bâtiments à dôme rouge manifestement inspirés de la qubba arabe sont précisément affectés du nom cuba. Mais cela est vrai aussi pour des mots pris à l’anglais comme chèque dont la longue histoire est passée à pertes et profits : le mot dérive de to chek, « vérifier », lui-même du vieux français eschec, dans lequel on reconnaît l’expression échec et mat qui vient d’une expression perse entendue dans oreille arabe comme al-shah mât, « le roi est mort ». Et il en est de même de termes pris à allemand comme benzène dont on oublie de signaler qu’il vient du latin benzoe, de l’arabe laban jawî, c’est-à-dire « la résine de Java ».

C’est le moment de parler du latin puisque la plupart des termes pris de l’arabe dans le registre scientifique sont passés par cette langue grâce aux clercs médiévaux, comme c’est le cas d’algèbre, d’élixir ou de safran, mais on se limite souvent à l’origine latine sans aller en amont : il en est ainsi pour benjoin, donné comme dérivé du latin benzoe sans indiquer que ce terme est lui-même, comme nous venons de le voir, d’origine arabe. Quant au mot risque, on lui préfère une ascendance latine discutable en rejetant l’arabe pourtant bien plus solidement établie. Nous avons là une illustration d’n parti des romanistes pris consistant à privilégier une étymologie latine ce qui entraîne une sous-estimation du legs lexical arabe. Une des formes originales de ce phénomène est ce que l’on pourrait nommer « court-circuit linguistique ». Quand on fait établit la filiation suivante : français girofle < latin gariofilum < grec karyophyllon, on écarte le fait ce sont vraisemblablement les Arabes qui ont introduit cette épice en Europe et même si le mot grec ressemble formellement au terme latin médiéval, on fait peu de cas du parallèle parfait, morphologique et sémantique, entre le sicilien garònfulu et le calabrais garónpulu comme l’italien garofano qui, tout comme l’arabe qaranful, signifient aussi bien « l’œillet » que l’épice dont il est question[1]. Nous nous limiterons à cet exemple mais nous avons ici la traduction, sur le plan linguistique, d’un phénomène mental de refoulement de l’influence culturelle arabe au profit de l’établissement d’une parenté directe, par latin interposé, avec la culture grecque antique…

Mais attention, il ne s’agit pas de tomber dans l’excès inverse que je nommerai le « syndrome de Chaykh Zoubir » du fait que l’on a voulu trouver au nom de Shakespeare une origine arabe… L’attitude consistant à considérer comme un mot d’origine arabe tout terme possédant une ressemblance formelle avec un mot appartenant à cette langue est en effet largement répandue. Je n’en donnerai qu’un exemple : un livre qui connaît hélas une largement diffusion, et dont je ne citerai pas l’auteur pour lui épargner le ridicule, commence par présenter le mot abbé comme dérivé de l’arabe ‘abbâd, « adorateur », en se laissant impressionner par la forme espagnole abad et sans voir que le terme latin abbas, -tis est l’araméen abâ qui signifie « père » tout comme l’arabe abû, et en ignorant de surcroît qu’abû-na est encore aujourd’hui le terme que les Arabes chrétiens emploient pour s’adresser à leur prêtre.

L’étymologie d’un terme n’est certes pas tâche légère et mérite une grande attention. Elle doit soumettre l’étymon supposé à un examen qui envisage la possibilité de voyage d’une langue à l’autre des points de vue sémantique et morpho-phonologique, et ce en rapport avec le contexte historique des langues et celui des mouvements des choses, des hommes et des idées, et se doit de formuler, au terme de cette étude, une hypothèse de scénario dont la valeur doit être évaluée avec précision. D’une façon générale, nous avons, dans les langues européennes, un lexique d’origine arabe suffisamment riche pour qu’il ne soit pas nécessaire de l’exagérer au risque de commettre des erreurs préjudiciables qui déconsidèreraient le travail d’estimation de l’héritage culturel arabe dans la civilisation européenne.

Deux autres pistes permettent d’avoir une vision plus précise des apports lexicaux de la langue arabe.

La première est celle des termes dérivés des mots empruntés. Ainsi abricot donne abricoté et abricotier, et azur permet azu rage, azurant, azuré, azuréen, azurer et azurite qui sont autant d’entrées comptant dans les entrées recensées dans les dictionnaires communs. Il faut donc les comptabiliser si l’on veut évaluer le poids des mots arabes dans le lexique français et nous devons ajouter de la sorte 250 entrées aux 425 déjà recensées dans le Petit Robert, ce qui porte le pourcentage de mots arabes à 2,2 %.

Une autre piste est celle des calques, c’est-à-dire de mots ou d’expressions créés par emprunt de sens ou de structure morphologique à une autre langue : un exemple classique est le français gratte-ciel pour l’anglais sky-scraper. Il est d’ailleurs un calque de l’arabe signalé par le Petit Robert : c’est le mot calculer dans l’acception de « regarder, prêter attention », prise récemment de l’arabe maghrébin par la langue des jeunes. Mais les calques sont innombrables, bien que parfois extrêmement difficile à débusquer. Que l’on pardonne un exemple qui oblige à un développement assez long mais, du moins je l’espère, significatif :

Il est acquis que le grec utilisait depuis Geminos, qui vivait au I^er siècle av. J.-C., l’hexekoston, soit le « soixantième » pour la division du degré d’arc, et distinguait successivement le soixantième prime, second, tierce, etc. Le mot finit par avoir comme synonyme lepton, littéralement « mince, menu », déjà utilisé chez Geminos comme « soixantième » du jour, soit 24 de nos « minutes » actuelles. Or il est attesté qu’au temps de Théon d’Alexandrie, soit à la fin du IV^e siècle de notre ère, la division en soixantièmes était appliquée à l’heure. Les Arabes simplifièrent la terminologie en utilisant pour les subdivisions du degré d’arc comme pour l’heure un calque de lepton, à savoir daqîqa, mais en pratiquement de curieuses ellipses : Al-Khwarimî donne ainsi daqîqa en sous-entendant ûlâ pour le « soixantième premier » et thaniyya tout court en sous-entendant daqîqa pour le « soixantième second ». Lorsque les clercs médiévaux traduisirent en latin le Zîj al-Sindhind, ils empruntèrent tout d’abord les mots du grand savant musulman, ce qui donna dakica et zenia, et il fallut quelques décennies au cours desquelles le premier de ces termes fut rendu par momentum, punctum ou encore minuta, terme que l’on avait d’ailleurs probablement déjà remarqué dans la littérature latine classique, et c’est probablement pourquoi l’on finit par se décider pour lui, et c’est de là que vient le français minute. Quant à zenia, ne trouvant pas de terme correspondant dans le glossaire astronomique latin, il fallut bien se résoudre à le créer, et il ne fut pas difficile de le rendre par sa traduction littérale, secunda, qui a donné le français seconde. Tout cela pour dire que le couple minute/seconde est bien un calque du couple arabe daqîqa/thaniyya. Qui penserait que ces mots que nous utilisons un nombre incalculable de fois chaque jour portent la marque de la langue et la science arabes ?[2]

Maxime Rodinson invitait à tenir compte des calques linguistiques et pas seulement des emprunts si nous voulons apprécier les héritages civilisationnels[3]. Et il n’est pas un domaine où l’examen minutieux des textes et de leurs traductions successives, ne mette en évidence en effet leur importance quantitative. Il est bien possible que leur recensement ne sera jamais accompli tant la tâche est immense et ardue, mais il est utile de l’affronter dans des domaines limités précis qui illustrent de façon parlante l’importance de l’apport de la civilisation arabe et islamique.

Nous avons considéré jusqu’ici le vocabulaire commun. Mais il est domaines spécialisés de la langue qui comptent un nombre considérable de mots arabes.

Le domaine des étoiles nous en fournit un exemple remarquable puisque pas moins des deux-tiers des étoiles qui portent un nom d’origine arabe, parmi les lesquels les plus courants sont Aldébaran, Bételgeuse, Véga ou Rigel que l’on retrouve largement dans la littérature. Les grands dictionnaires encyclopédiques et les dictionnaires des noms propres des grandes éditions ne comptent que peu de noms d’étoiles : ils ne dépassent pas la vingtaine. Et il faut consulter les catalogues et atlas astronomiques pour trouver des listes plus copieuses qui peuvent compter entre 100 et 200 communs d’origine arabe, le total des appellations recensées dépassant largement les 300 noms.

Un autre domaine largement connu du public mais absent des dictionnaires est celui des prénoms dont le nombre grandit en proportion des populations installées en France en provenance de pays arabes et plus généralement musulmans. Le nombre de nos compatriotes et des résidents de culture religieuse musulmane, pour utiliser un terme qui ne considère pas la pratique stricte de la religion mais qui influe sur la manière de nommer les enfants, varie entre 3,7 millions selon l’estimation de l’INSEE et 5 à 6 millions selon les chiffres donnés par le Président de le République, ce qui donne entre 6 et 10% de la population. Cela ne va sans avoir une certaine influence sur l’univers des dénominations qui a donc changé d’aspect dans les dernières décennies et qui intègre désormais de façon courante des noms arabes à côté des noms classiques du calendrier des Postes dont les plus fréquents sont d’origine hébraïque comme Sarah ou Matthieu, grecque comme Alexandre ou Hélène, latins comme Cécile ou Paul, germanique comme Adèle ou Bertrand sans parler des prénoms celtiques comme Gwénael ou Erwan, ou formes anglo-saxonnes comme Vanessa ou Kevin. Il est d’ailleurs notable qu’un courant de la mode se porte aujourd’hui sur des prénoms arabes et musulmans qui paraissent assez discrets, voire ambivalents dans le paysage comme Linda ou Sophia pour les filles, Elias ou Rayan pour les garçons. Tandis que, réciproquement, certains prénoms comme Leila ou Naïma ont conquis des milieux sans aucune tradition arabe ou musulmane.

Ce qui ressort cette courte présentation du legs de la langue arabe dans le lexique français est une certaine sous-estimation du poids. Et ce phénomène qui se double malheureusement d’une absence d’un cadre universitaire pour le travail étymologique lui-même tr-s limité, ceci à la différence des pays voisins comme l’Allemagne, l’Italie ou l’Espagne où existent de façon vivante des départements de philologie arabe. On mesure la gravité du problème en évoquant le fait suivant : les travaux poursuivis en Espagne par un Federico Corriente sur plusieurs décennies et qui lui ont permis de publier un Dictionnaires des arabismes ne sont aucunement répercutés dans les dictionnaires français qui s’attachent pourtant à donner l’étymologie des termes qu’ils présentent, à savoir le Trésor de la langue française ou le Robert historique.

C’est de ce constat qu’est née SELEFA, la Société d’Études Étymologiques et Lexicographiques Française et Arabes. Elle a grandi dans un cadre non-académique mais elle est au cœur d’un réseau comptant de nombreux universitaires de différentes nationalités, d’Europe et du Monde arabe. Et elle peut s’enorgueillir, au bout de huit années d’activité, d’un bilan étymologique portant notamment sur les champs sémantiques suivants : les noms arabes d’étoiles, les prénoms arabes et musulmans, les mots arabes dans la langue des jeunes, les mots d’origine arabe et orientale dans les culinaires, ou les mots de l’Islam, etc.

L’utilisation du legs de la langue arabe du lexique française peut se révéler un excellent moyen éducatif et SELEFA tente de l’utiliser en doublant le volet Recherche linguistique de son activité par le volet de Partage des héritages culturels portés par ces mots : une action éducative qui se révèle particulièrement fructueuse est l’action intitulée « Nos prénoms, notre richesse » qui consiste à partager tous les prénoms d’un groupe, que ce soit dans les écoles ou des centres sociaux.

Il faut dire pour conclure qu’un énorme travail reste à faire pour établir un glossaire sérieux des mots arabes dans la langue française et se donner ainsi un outil précieux non seulement du point de vue scientifique mais également culturel et éducatif[4].

NOTES :

[1] Voir LAFFITTE, Roland, « Les routes du girofle (la chose et les mots) : Un éclairage sur le rôle de l’arabe قرنفل qaranful », Bulletin de la SELEFA n° 14, 1^er semestre 2009, p. 1-24.

[2] Voir LAFFITTE, Roland, « Ce que degré et minute / seconde doit à l’arabe درجة darağa et دقيقة daqīqa / ثانية ðāniyya », Bulletin de la SELEFA n° 14, 1^er semestre 2009, p. 1-14.

[3] Voir RODINSON, Maxime, « Quelques emprunts arabes dans les langues romanes au Moyen-Âge », Compte rendus du GLECS, t. v, 1948-1951, p. 3, repris dans le Bulletin de la SELEFA n° 4, 2^ème sem. 2004, p. 11.

[4] On peut avoir une idée des activités de SELEFA sur les sites : www.selefa.asso.fr et www.uranos.fr.

le legs de la langue arabe au lexique français

Contribution à la Journée d’étude organisée sur le thème Enseignement, Langue et Culture arabes en France : réalités et perspectives, le 3 avril 2010, au Palais du Luxembourg (Sénat), Paris, par le CCMF, Gnôsis et SELEFA.

Email