
2025-09-05 15:53:52
Des chercheurs africains ont créé ce qui semble être le plus grand ensemble de données sur les langues autochtones du continent, dans le but de garantir que des millions de personnes ne soient pas exclues des progrès de l’intelligence artificielle, tels que les chatbots.
Bien que l’Afrique abrite plus d’un quart des langues du monde, la plupart d’entre elles sont absentes du développement de l’IA.
La majorité des outils, tels que ChatGPT, sont principalement formés à partir de l’anglais, des langues européennes et du chinois, qui bénéficient d’une grande quantité de textes en ligne. Mais de nombreuses langues africaines sont plus souvent parlées qu’écrites, ce qui laisse peu de matériel pour former les systèmes d’IA et limite leur utilité pour les locuteurs à travers le continent.
Le professeur Vukosi Marivate, qui enseigne à l’université de Pretoria, a déclaré à la BBC : “Nous pensons dans nos propres langues, nous rêvons dans nos propres langues et nous interprétons le monde à travers nos propres langues. Si la technologie ne reflète pas cela, tout un groupe risque d’être laissé pour compte. Nous traversons cette révolution de l’IA, en imaginant tout ce qui peut être fait avec elle.
Imaginez maintenant qu’une partie de la population n’y ait tout simplement pas accès parce que toutes les informations sont en anglais.”
Visit Bang Premier (main website)