Ce document se veut une introduction à la diversité des langues du monde, au rôle politique ou religieux qu'elles peuvent jouer et aux risques de disparition de ces langues ainsi que, potentiellement, des cultures qui y sont associées.
Pour faciliter la lecture et pour vous permettre d'approfondir certains sujets, les termes techniques soulignés renvoient vers le web pour une définition/explication.
Il y a 7139 langues parlées aujourd'hui sur notre planète, dont environ 1000 parlées par quatre millions d'habitants de l'archipel de la Nouvelle-Guinée. Parmi celles-ci, 800 sont des langues papoues en rouge sur la carte, selon www.ethnologue.com qui est une des références dans le domaine.
Si l'on inclut les 25 000 îles de l’Insulinde en jaune/beige sur la carte, alors il y aurait environ 2000 langues parlées par une population de 380 000 000 d'habitants environ (5% de la planète pour 30% des langues).
Environ 2500 langues sont en danger, ce qui fait que les nombres ci-dessus évoluent. Et la géopolitique en crée de nouvelles : tchécoslovaque remplacé par tchèque et slovaque.
Le niveau de danger est variable selon des critères proposés par l'UNESCO dans son Atlas des langues
en danger dans le monde.
Les notions de langue officielle, langue nationale et système d'écriture officiel ne sont pas du tout universelles. Voir les articles correspondants en cliquant sur les liens. Ainsi, l'Italie n'a de langue officielle que depuis 1999, officialisée à l'occasion de la ratification de la Charte européenne des langues régionales ou minoritaires. Les Etats-Unis n'ont pas de langue officielle. Mais la moitié des Etats en ont une, l'Alaska, Hawaï et le Dakota du Sud en ont plusieurs.
Par ailleurs le comptage des dialectes et des variantes d'une même langue est un sujet délicat techniquement et politiquement qui peut modifier les nombres. La différence entre une langue et un dialecte est souvent politique et peut varier d'un linguiste à un autre. Il se dit parfois qu'une langue est un dialecte qui a réussi.
Par exemple, sous Tito la langue principale était le serbo-croate. Il existe aujourd'hui 4 langues nationales qui la remplacent : croate, serbe, bosniaque et monténégrin. Et ces langues divergent pour des raisons politiques et culturelles, alors qu'elles étaient plus proches que ne le sont l'anglais de Grande-Bretagne et l'anglais américain.
De même, lors de la partition de l'Inde, le Pakistan musulman et l'Inde à majorité hindouiste ont renommé l'Hindoustani parlé dans le nord du sous-continent indien en Urdu et Hindi. Le premier s'écrivant en caractères arabo-persans اُردُو et le second en caractères Devanagari देवनागरी. Et les nouveaux mots utilisent plutôt des racines persanes au Pakistan et sanscrites en Inde. Les langues ont ainsi divergé jusqu'au succès international de Bollywood en Hindi qui entraine une certaine convergence entre ces langues.
Ecriture et informatique
Au début de l'informatique dans les années 1960-1970, on ne pouvait écrire et imprimer que les caractères latins non accentués suffisants pour l'anglais.
C'est ainsi que petit à petit il a été nécessaire de codifier au niveau international les différents systèmes d'écriture de façon à permettre leur affichage sur tous les systèmes informatiques. Et pour permettre l'échange de documents informatiques, une normalisation internationale s'est vite avérée indispensable. Ainsi, le présent texte est en principe lisible sur tous les systèmes informatiques et est imprimable partout.
La norme ISO 639-3 codifie les noms de langues et en codifie 8140, incluant les langues mortes et les langues construites.
De façon à permettre l’interopérabilité des fichiers texte, Unicode et l'ISO 10646 codifient dans un Jeu Universel de Caractères codés (JUC) environ 110 000 caractères. La Chine a ajouté des codifications à ce jeu de caractères obligatoire pour tous les systèmes vendus en République Populaire de Chine.
Les systèmes d'écriture
Environ 3982 langues ont un système d'écriture selon le site Omniglot
Et selon le même site il y a 34 systèmes d'écriture distincts actifs aujourd'hui dont la majorité est utilisée dans le sous-continent indien.
Six systèmes d'écriture ont une vocation continentale, voire mondiale : les alphabets latin, cyrillique, arabe et hébreu, l’alpha-syllabaire brahmi et ses variantes ainsi que les sinogrammes.
Les autres systèmes d'écriture sont aujourd'hui l’alpha-syllabaire guèze qui sert à écrire les langues éthiosémitiques (100 millions de locuteurs), les écritures géorgiennes, arméniennes et coréennes. Ainsi que le tifinagh, l'alphabet ancestral berbère que les pays du Maghreb tentent de faire revivre.
Tous les systèmes d'écriture alphabétiques et alpha-syllabaires dérivent des systèmes d'écriture préhistoriques de Mésopotamie. Néanmoins, certains scientifiques indiens penchent pour une origine endogène des écritures indiennes.
L'alphabet Latin
L'alphabet latin est utilisé dans plus de 1000 langues avec une adaptation par signes diacritiques et/ou par doubles consonnes pour s'adapter aux sons des différents langages. Il y a également des signes diacritiques pour décrire les tons des langues tonales comme le vietnamien.
Compte tenu du nombre de sons différents sur notre planète, il y a plusieurs centaines de diacritiques différents, rien que pour l'alphabet latin. Voir détail diacritiques. Il existe également des caractères supplémentaires, en plus des 26 caractères de base, pour certaines langues.
Parmi ces signes diacritiques peu connus en France, il y a le macron, l'ogonek (Ą, ą, ę, Į, į), le caron (č, ř, š, ž, ď, ť, ľ, ǎ, ě, ǒ), le chandrabindu, le double accent aigu utilisé uniquement en hongrois (Ű, ű), etc...
La plupart de ces adaptations furent le fait de religieux européens qui ont inventé une écriture pour les langues non écrites de façon à traduire et imprimer la bible dans le cadre de l'évangélisation.
D'autre part l'Alphabet phonétique international est en grande partie basé sur l'alphabet latin. Il comprend 107 lettres, 52 signes diacritiques et 4 caractères de prosodie.
L'alphabet cyrillique
Une soixantaine de langues non slaves parlées dans l'ex-Union Soviétique s'écrivaient en caractères cyrilliques.
Le kazakh, l'ouzbek, l'azéri sont passés de l'écriture arabe, aux lettres latines puis cyrilliques pour revenir au latin à la chute de l'URSS. La plupart des langues non slaves ont arrêté le cyrillique.
L'alphabet arabe
Pratiquement toutes les langues des pays islamisés se sont écrites avec l'alphabet arabe ou arabo-persan, de l'espagnol au malais en passant par le somali au turc. C’est ce que l’on appelle un aljamiado.
La plupart de ces langues sont passées à l'alphabet latin, sauf les langues indo-iraniennes des pays musulmans. A l'exception des kurdes qui écrivent en latin, arabo-persan ou cyrillique (durant l'URSS) suivant le pays de résidence.
L'alphabet arabo-persan dispose de 4 consonnes de plus que l'alphabet arabe :[p] (پ), [tch] (چ), [j] (ژ) et [g] (گ).
L'alphabet arabe, comme l'hébreu, est en fait un abjad, c'est-à-dire que la plupart des voyelles ne s'écrivent pas. Il s'écrit de droite à gauche comme l'hébreu.
Les alphabets dérivés de la brahmi
Cet alpha-syllabaire a servi de base aux différents alpha-syllabaires du sous-continent indien, ainsi que de l'Extrême-Orient sous l'influence de la diffusion de l’hindouisme et du bouddhisme. Cette diffusion s'est étendue jusqu'au javanais, au balinais et à quelques îles des actuelles Philippines. Néanmoins ces langues, quand elles sont parlées au Pakistan, s'écrivent dans des variantes de l'alphabet arabo-persan. Ainsi, en pendjabi on écrit ਪੰਜਾਬੀ ou پنجابی suivant que l'on écrit en Inde ou au Pakistan.
A l'opposé du Pakistan, le Bangladesh (ex-Pakistan oriental), également musulman, écrit le bengali avec l'alphabet bengali identique à celui de Calcutta বাংলাদেশ. Il est à noter que la raison majeure de l'indépendance du Bangladesh le 25 mars 1971 est linguistique1.
Parmi toutes ces langues, seules les langues de l'Inde du Nord sont indo-européennes. Voici « bonjour » dans différentes langues de l'Asie utilisant aujourd'hui une écriture dérivée de la brahmi.
ਸਤ ਸ੍ਰੀ ਅਕਾਲ, नमस्ते, வணக்கம், สวัสดี, བཀྲ་ཤིས་བདེ་ལེགས།, ഹലോ, ಹಲೋ.
Les sinogrammes
Les sinogrammes sont, à ma connaissance, le seul système d'écriture logographique actuellement en usage dans le monde. Ils sont utilisés pour écrire les différents dialectes chinois et le japonais.
Les avantages du système logographique :
- Ecriture indépendante de la prononciation. C'est pourquoi les films et les émissions de TV chinois sont la plupart du temps sous-titrés pour être compris dans toute la Chine. Par exemple, « sortie » s'écrit 出口 en chinois et en japonais, mais se lit Chūkǒu en mandarin et Deguchi en japonais.
- Pas ou peu de flexions grammaticales
- Il semble qu'il soit plus rapide d'écrire un texte en chinois qu'en anglais avec un clavier virtuel prédictif (voir plus bas).
Les inconvénients :
- Pas de machine à écrire avant l'informatique de bureau. Ou pour être plus précis, des machines très complexes avec 4000 caractères. Voir https://fr.qaz.wiki/wiki/Chinese_typewriter
- Pas de Telex, qui était le seul moyen de communication écrite longue distance depuis les années 1930 (en plus du Morse), qui était limité à 32 caractères différents. C'est pourquoi les japonais ont développé le fax dans les années 1980.
- Les enfants ne lisent couramment que vers 10 ans. Avant ils sont aidés par différents systèmes phonétiques, comme le bopomofo.
- Avant l'informatique, les imprimeries à caractères mobiles étaient très complexes en raison du nombre de caractères différents. Ce qui n'a pas empêché la Chine d'inventer ce type d'imprimerie plusieurs siècles avant Gutenberg.
L’effectif précis des sinogrammes existants est sujet à débat. Leur nombre peut se compter en dizaines de milliers, les estimations vont de 40 000 à plus de 60 000 si on prend en considération leur nombre sur la durée totale d’existence de l’écriture chinoise. Mais les ¾ sont des variantes graphiques qui ne sont plus utilisées. Le chinois courant requiert la connaissance de 3 000 à 5 000 sinogrammes et le japonais de 2 000 à 3 000 (appelés kanjis). En effet, le japonais utilise deux syllabaires en plus des kanjis : les 46 hiraganas et les 46 katakanas.
Mao Zedong a imposé la simplification des sinogrammes pour faciliter l'alphabétisation du peuple. Cette simplification n'est pas mise en œuvre à Taiwan et à Hong-Kong.
Avec un clavier virtuel prédictif comme ci-dessous, il semble qu'il soit plus rapide d'écrire un texte en
chinois que le même texte dans les langues occidentales.
Bonjour se dit Nǐ hǎo en mandarin (écrit en pin yin) et s'écrit 你好. Avec un clavier virtuel prédictif on le tape avec 4 appuis de touche ou moins, les sinogrammes apparaissant au fur et à mesure de la frappe au clavier comme dans la figure ci-dessus. Dans l'image ci-dessus, après avoir tapé ni, le premier sinogramme apparaît parmi d'autres. Et après l'avoir sélectionné, on a l'image ci-dessus des différents sinogrammes suggérés dont celui de bonjour apparaît à gauche, car il est le plus probable.
L'alphabet hébreu a été utilisé pour écrire de nombreuses langues parlées par les juifs au cours de leurs migrations. La Shoah, l'exode des juifs des pays arabes et la création d'Israël limitent maintenant son usage principalement pour écrire le hébreu et le yiddish. Le yiddish est la langue des juifs ashkénazes basée sur l'allemand rhénan du Moyen Âge intégrant des mots hébreux et des locutions slaves au fur et à mesure de la migration des juifs vers l'est. Le Yiddish est encore aujourd'hui langue officielle du Birobidjan au fin fond de la Sibérie.
Le judéo-espagnol est la langue des Sépharades, descendants des juifs expulsés d'Espagne en 1492, suite au décret de l’Alhambra, et accueillis dans l'Empire ottoman. Il est basé sur le castillan du Moyen Âge. Il s'écrit maintenant en caractères latins.
Shahin Shirazi, célèbre poète juif perse contemporain de Hafez au 14ème siècle, écrivait le perse et le judéo-perse en caractères hébraïques comme dans le livre d'Esther versifié ci-contre.
Voir une synthèse des langues juives ici.
Les chiffres arabes
Les chiffres arabes sont universellement utilisés 1234567890...sauf dans les pays arabes, hors Maghreb,
qui utilisent en priorité des chiffres dérivés de l'In
de١٢٣٤٥٦٧٨٩٠. Mais en Inde, on privilégie d'autres caractères comme indiqué dans la table ci-contre.
Nota : l'arabe et l'hébreu s'écrivent de droite à gauche, sauf les chiffres qui s'écrivent de gauche à droite. Ce qui rendait la dactylographie avec machine mécanique un peu compliquée. Problème résolu par les traitements de texte qui inversent automatiquement le sens d'écriture et permettent aussi d'insérer facilement des mots écrits en caractères latins.
Translittération
Les explorateurs et colonisateurs ont toujours eu besoin d'écrire en caractères latins les noms des personnes et des lieux rencontrés. Mais chaque pays l'a fait en tenant compte de sa manière de prononcer et de ses règles orthographiques. Ce qui fait qu'il y a parfois autant d'orthographes d'un même mot que de langues occidentales.
Ainsi le célèbre collectionneur d'art russe Сергей Иванович Щукин s'écrit en Français Chtchoukine. Mais chaque pays/langue a son orthographe : Sxukin, Shchukin, Schtschukin, Ščukin, Sjtsjoekin, Şukin. Il faut dire que la consonne Щ est difficile à prononcer pour un gosier occidental.
Et Jivago du roman До́ктор Жива́го s'écrit suivant les langues : Zhivago, Schiwago, Živago, Zjivago, etc...
De même Mao Zedong, son nom officiel, s'écrivait jadis Mao Tse-tung, Mao-Tsé-toung, Mao Tsé-Tung suivant les pays.
La Chine populaire utilise une méthode assez autoritaire et impose petit à petit la translittération Pin Yin, conçue dans les années 50, avec des signes diacritiques pour signaler les tons. Ainsi un occidental peut apprendre le chinois sans apprendre les sinogrammes, avec la même orthographe dans tous les pays.
Zoom sur l'écriture des langues slaves
Les moines orthodoxes grecs ont eu le même besoin d'écrire la bible dans les langues slaves des peuples qu'ils ont évangélisés. Et bien entendu, ils ont adapté l'alphabet grec pour le faire. Pi, Delta, Phi, Gamma, Rhô, Lambda sont très proches en grec et en russe. Ainsi П, Д, Ф, Г, Р, Л en majuscule russe (Π, Δ, Φ, Γ, Ρ, Λ en grec) se lisent P, D, F, G, R, L.
Les plus connus de ces évangélisateurs sont Saint Cyrille et son frère Méthode. L'alphabet inventé s'est ainsi appelé le cyrillique. L'alphabet cyrillique russe compte 33 lettres depuis 1917 au lieu de 37 avant et pas de signe diacritique. Néanmoins de nombreux diacritiques sont utilisés pour écrire les langues non slaves de l'ère soviétique. Et des lettres spécifiques existent pour chaque langue slave.
Mais les évangélisateurs catholiques des slaves ont bien entendu utilisé l'alphabet latin.
Ainsi donc, l'alphabet latin est utilisé pour le polonais, le tchèque, le slovaque, le slovène, le croate, le sorabe, le kachoube, etc...
Le cyrillique pour le russe, l’ukrainien, le biélorusse, le serbe (lequel utilise aussi un alphabet latin pour des raisons politiques), le bulgare et le macédonien.
Pour les langues non slaves de l'Europe centrale et pour les mêmes raisons, le hongrois (langue ouralienne non indo-européenne) et le roumain (langue latine) furent écrits respectivement en caractères latins et cyrilliques au moment de l'évangélisation.
Une mention particulière politique doit être ici faite pour le roumain :
- Au 19ème siècle, des lettrés roumains de Transylvanie (dans l'empire austro-hongrois) ont introduit l'alphabet roumain actuel utilisant les lettres latines, au lieu du cyrillique.
- À partir de 1938, la République socialiste soviétique moldave a repris un alphabet cyrillique plus proche de l’alphabet russe, et donc différent du premier.
- Puis à l'indépendance de la Moldavie, l'alphabet roumain a été repris pour écrire le soi-disant moldave qui est en réalité du roumain...
- Sauf en Transnistrie sécessionniste qui continue à utiliser le cyrillique pour écrire le roumain.
Les grandes familles de langues
Les linguistes ont regroupé les langues par
famille. En principe une famille de langues regroupe des langues qui ont un ancêtre commun et donc des racines communes. La carte illustre les principales familles de langues dans le Monde.
En Europe, les familles suivantes sont représentées :
- Les langues indo-européennes généralement subdivisées en huit branches : l'albanais, l'arménien, les langues balto-slaves, les langues celtiques, les langues germaniques, les langues helléniques, les langues indo-iraniennes (parlées par les Roms), les langues romanes.
- Les langues finno-ougriennes : Hongrois, Finnois, Estonien et les langues sames de Laponie, etc..
- Une langue sémitique : le Maltais
- Les langues turciques parlées à Chypre, dans la partie européenne de la Turquie, en Bulgarie et en Moldavie (Gagaouzie)
- Les langues caucasiennes : géorgien, tchétchène, abkhaze, etc... Certains rapprochent le basque des langues caucasiennes.
- Le Basque qui est un isolat apparenté à aucune famille linguistique
- Les langues de l'immigration extra-européenne.
Les langues du continent américain
Le continent américain abrite environ 1000 langues autochtones encore parlées aujourd'hui, regroupées en grandes familles de langues de tailles très variables. Le nahuatl et les langues mayas en Amérique centrale, quechua, aymara, guarani en Amérique latine sont parlées chacune par plusieurs millions de locuteurs aujourd'hui. Les jeunes générations parlent presque tous également la langue dominante du pays où ils habitent (anglais, espagnol, portugais, français ou néerlandais).
Les pays d'Amérique n'ont pas nécessairement de langue officielle, ou alors ils en ont 36 comme le Pérou et la Bolivie.
Les deux exceptions notables sont :
- Le Canada avec le Français et l'Anglais
- Le Paraguay avec le Guarani, langue nationale, et l'Espagnol.
Les langues et la naissance des nations modernes
La fin du dix-neuvième siècle a vu la naissance de nombreux Etats Nation modernes, ou du moins la création de mouvements projetant la création d'une nation.
Dans quelques cas, la langue fût un élément important du projet de nation.
- Ainsi le Risorgimento a promu le florentin, langue de culture et de Dante Alighieri, parlé par 2% d'italiens à l'époque.
- Dès le début du sionisme, l'hébreu fût choisi comme future langue d'Israël, alors que c'était une langue morte utilisée uniquement pour les commentaires des textes sacrés. Eliezer Ben-Yehuda est généralement crédité comme l'inventeur de l'hébreu moderne. Ses fils seraient les premiers enfants depuis 2000 ans à avoir l'hébreu comme langue maternelle. Le vocabulaire moderne a souvent été construit à partir de racines arabes adaptées à la phonologie et la grammaire hébraïque.
- Les mouvements indépendantistes indonésiens ont choisi le malais, langue étrangère, comme langue nationale. Il a été renommé Bahasa Indonesia.
- Franco et Tito ont essayé, vainement, d'imposer respectivement le castillan et le serbo-croate comme langue nationale.
Les langues d'Afrique
Les langues officielles de l'Union Africaine sont :l’arabe, l’anglais, le français, le portugais, l’espagnol et le kiswahili.
Une seule des 2000 langues africaines est officielle dans l'Union Africaine.
Il existe un véritable enjeu de l'enseignement des langues africaines dans les systèmes scolaires.
Voir https://www.globalpartnership.org/fr/blog/lenseignement-dans-la-langue-maternelle-en-afrique
« En effet, dans la plupart des pays africains, les langues maternelles sont introduites comme matières et véhicules d’enseignement, en articulation avec d’autres langues internationales de grande diffusion (langues officielles/étrangères).
À cet effet, l’un des défis majeurs est de faire évoluer les modèles d’enseignements bilingues actuels, à dominante soustractive ou de sortie précoce de transition, vers des modèles de sortie tardive pouvant déboucher sur un bilinguisme additif ou équilibré. »
Pour une synthèse des langues en Afrique, voir https://en.wikipedia.org/wiki/Languages_of_Africa
Conclusion
La communauté internationale est consciente du risque de disparition des langues minoritaires.
L'UNESCO publie des statistiques et organise chaque année la journée de la langue maternelle (21 février). Mais la préservation des langues minoritaires passe par des décisions politiques fortes, des actions locales et le bilinguisme. Le basque beaucoup plus développé en Espagne qu'en France est un exemple caractéristique du type d'action nécessaire à la revitalisation d'une langue minoritaire, faite parfois au détriment des non-bascophones qui se sentent discriminés.
La Charte européenne des langues régionales ou minoritaires est un traité européen, proposé sous l'égide du Conseil de l'Europe et adopté en 1992 par son Assemblée parlementaire, destiné à protéger et favoriser les langues historiques régionales et les langues des minorités en Europe.
La ratification du traité par la France nécessite une loi constitutionnelle votée par l'Assemblée Nationale en janvier 2014. Le texte est rejeté par le Sénat le 27 octobre 2015, empêchant la ratification.
Néanmoins, la France applique une partie de la Charte.
Libellés : abjad, alphabet, écritures, Langues