Comment les langues africaines passent au numérique

Table des matières:

Comment les langues africaines passent au numérique
Comment les langues africaines passent au numérique

Vidéo: Les langues africaines contiennent des éléments scientifiques 2024, Mai

Vidéo: Les langues africaines contiennent des éléments scientifiques 2024, Mai
Anonim

La numérisation des langues africaines est un processus complexe mais nécessaire. Aujourd'hui, des universitaires et des sociétés de technologie de l'information du monde entier travaillent ensemble pour intégrer de nouvelles langues dans diverses formes de logiciels et de technologies.

Bien qu'il existe des milliers de langues parlées dans le monde (dont beaucoup en Afrique seulement), quelques-unes, comme l'anglais, sont toujours omniprésentes, en particulier en ce qui concerne les outils et technologies numériques. Jusqu'à récemment, les outils de traduction, d'orthographe et de grammaire étaient principalement destinés aux langues occidentales dominantes. Cet objectif commence à changer, bien que lentement, pour numériser davantage de langues africaines.

Image

Développement de la technologie du langage humain

Historiquement, les langues autochtones africaines n'ont pas reçu la même reconnaissance en matière d'intégration technologique. Cependant, alors que la technologie continue de pénétrer de nouveaux marchés africains, de plus en plus d'entreprises voient la nécessité d'améliorer la technologie du langage humain (HLT) sur le continent. Cela est essentiel à la fois pour le développement technologique en cours et pour la préservation de la pierre angulaire des cultures à l'ère numérique.

Selon l'Université d'Arizona, les langues et les technologies de l'information se rencontrent régulièrement dans le monde entier, d'où le besoin de recherche et développement compétents: «Partout où la langue entre en contact avec les technologies de l'information, ou là où les humains ont besoin d'interagir avec les ordinateurs, les besoins linguistiques être [organisé] afin qu'il puisse être manipulé et traité par des moyens informatiques. Cela nécessite souvent une connaissance approfondie non seulement de la linguistique et du fonctionnement des langues, mais aussi de l'informatique et des domaines connexes. »

Des géants de la technologie investissent dans les langues africaines

En conséquence, de nombreuses grandes sociétés, y compris des géants de la technologie comme Facebook et Google, investissent dans des HLT pour les langues africaines (ne serait-ce que pour accroître leur portée sur le marché et leurs profits). Les premiers changements notables sont venus sous la forme de la possibilité d'utiliser Google dans diverses langues africaines. Certaines entreprises, telles que Microsoft, intègrent également des langues africaines dans les correcteurs orthographiques et les outils de grammaire.

Cependant, il y a encore de graves lacunes et beaucoup de travail reste à faire. Comme le souligne la chercheuse Maria Keet, intégrer de nouvelles langues avec la technologie de manière précise et significative est plus que simplement actionner un commutateur, et nécessite plutôt une approche intégrée: «Quel est l'intérêt de rechercher le Web dans, disons, [langue sud-africaine] isiXhosa lorsque il n'y a que quelques documents en ligne dans isiXhosa et les algorithmes des moteurs de recherche ne peuvent pas traiter les mots correctement de toute façon, donc vous ne renvoyez pas les résultats que vous recherchez?

Plus complexe qu'il n'y paraît

Keet souligne la nécessité d'outils de traitement de texte pour incorporer des langues comme celles-ci dans les correcteurs orthographiques afin d'aider tout le monde - des écoliers aux professionnels - à rédiger des papiers, des documents, des messages et des e-mails dans leur langue maternelle.

La numérisation de n'importe quelle langue est compliquée et nécessite des recherches et des tests approfondis avant d'atteindre une étape de mise en œuvre automatique. Les langues africaines nécessitent également beaucoup plus de travail que l'anglais.

Alors que les règles de syntaxe de base ont été utilisées pour numériser la langue anglaise, de nombreuses langues africaines sont constituées de phrases qui dépendent fortement du contexte de la situation, ont des verbes et des structures de phrases complexes, et ne sont donc pas facilement accessibles aux outils automatiques utilisant des données structurées.

En conséquence, les chercheurs doivent créer des moteurs de grammaire pour générer des phrases de base. Ceux-ci exécutent des algorithmes complexes qui s'inspirent de textes existants, ce qui soulève une série de problèmes supplémentaires.

La technologie linguistique la plus moderne s'inspire des textes traditionnels © Glen Noble / Unsplash

Image

Se nourrir de textes existants

Au cœur de tout apprentissage numérique des langues se trouvent des textes existants et ces algorithmes se nourrissent de ceux-ci. La localisation et la compilation de ces textes est difficile pour de nombreuses langues africaines, étant donné le biais historique en faveur des langues occidentales en matière de publication.

Malgré les difficultés, les organisations à travers le continent commencent à identifier et à mettre en commun des documents en langue maternelle de haute qualité qui incluent non seulement une orthographe et une grammaire précises, mais sont également suffisamment modernes pour être considérés comme pertinents aujourd'hui. Sans ce contexte culturel, les algorithmes logiciels courent le risque d'être inexacts et insensibles au mieux, et carrément racistes au pire.