Página de inicio :Juega con la tecnología, mira el futuro a tu manera

La IA ignora los idiomas africanos, los investigadores lanzan una iniciativa de datos para cerrar la brecha

Investigadores de toda África lanzan una iniciativa para crear datos de idiomas africanos y superar la negligencia de estos idiomas en la IA.

Última actualización

Más de 2,000 idiomas hablados en África están siendo ignorados en la era de la inteligencia artificial (IA). Por ejemplo, ChatGPT solo reconoce entre el 10% y el 20% de las oraciones escritas en Hausa, un idioma hablado por 94 millones de personas en Nigeria. Estos idiomas están subrepresentados en los grandes modelos de lenguaje (LLMs) debido a la falta de datos de entrenamiento. Sin embargo, los investigadores de toda África están cambiando esto. Los especialistas en lenguas han grabado 9,000 horas de personas hablando diferentes idiomas africanos y han transformado esas grabaciones en conjuntos de datos digitalizados. Los investigadores, que forman parte de un proyecto de investigación denominado African Next Voices, publicaron este mes la primera tanda de datos de lo que se considera la mayor iniciativa de creación de datos lingüísticos listos para IA para varios idiomas africanos.