Les outils d’intelligence artificielle (IA) disponibles en Afrique fonctionnent presque tous en anglais ou en français ; ce décalage laisse des millions de locuteurs de langues locales, comme au Burkina Faso, sans accès aux technologies numériques. Le Burkina Faso engage désormais des travaux pour combler cette lacune.
Le 24 mars 2026 à Ouagadougou, un atelier organisé par le ministère en charge du numérique a réuni experts et praticiens autour de la formalisation linguistique et de la constitution de corpus en langues nationales. Quatre langues sont au centre des discussions : le mooré, le dioula, le fulfuldé et le gulmancema. La rencontre rassemble des enseignants-chercheurs, des linguistes, des journalistes et des spécialistes de l’IA. L’objectif est de produire des ressources structurées permettant d’entraîner des modèles capables de reconnaissance vocale, de traduction automatique et de synthèse vocale.
Le projet est mené en collaboration avec la Radiodiffusion Télévision du Burkina et plusieurs structures de recherche. Le ministère a précisé que l’atelier vise à bâtir « une intelligence artificielle inclusive, accessible et adaptée au contexte socioculturel » du pays. Les travaux s’inscrivent dans les douze chantiers de la transformation digitale à l’horizon 2030, notamment le chantier dédié à « une intelligence artificielle au service de tous les Burkinabè ».
Ce mouvement ne s’arrête pas aux frontières du Burkina Faso. D’autres pays africains avancent sur un terrain similaire. En septembre 2025, le Nigeria a officiellement lancé N-ATLAS v1, un modèle de langage open source construit sur l’architecture Llama-3 de Meta et entraîné sur plus de 400 millions de tokens multilingues. Ce modèle prend en charge le yoruba, le haoussa, l’igbo et l’anglais avec accent nigérian. Selon Dr Bosun Tijani, ministre nigérian des Communications, N-ATLAS « place les voix et la diversité africaines au fondement de l’IA ». Au Bénin, le projet JaimeMaLangue poursuit un travail analogue pour donner aux langues béninoises une existence dans les environnements numériques.
Les géants technologiques s’intéressent aussi à ce chantier continental. En février 2026, Google a lancé WAXAL, un programme de collecte de données vocales couvrant 21 langues africaines, dont le haoussa, le yoruba, le swahili, le luganda et le peul. Les données appartiennent aux institutions partenaires africaines, notamment l’université Makerere en Ouganda et l’université du Ghana, ce qui pose un modèle plus équitable de développement de l’IA.
Pour le Burkina Faso, la production de corpus fiables répond à une réalité démographique concrète. Le mooré est parlé par plus de la moitié de la population. Le dioula, le fulfuldé et le gulmancema couvrent l’essentiel des autres locuteurs. Sans données locales en quantité suffisante, aucun modèle d’IA ne peut produire des résultats utilisables dans ces langues. C’est précisément ce vide que les travaux engagés à Ouagadougou cherchent à combler.
Selon We Are Tech Africa, ce mouvement marque une rupture dans la posture des gouvernements africains face à l’IA. Le continent ne se contente plus de consommer des technologies conçues ailleurs. Il commence à les façonner selon ses propres réalités linguistiques et culturelles.
Voir aussi : OMC : À Yaoundé, le choc des modèles entre protectionnisme américain et multilatéralisme