Una lengua sin importancia: las consecuencias de descuidar las lenguas marginadas en el mundo digital

/userfiles/image/Rowe_Image_03-24-22.jpg


La mayor parte de los contenidos, servicios y herramientas de Internet están disponibles sólo en unas pocas docenas de lenguas de las economías poderosas, lo que deja a los hablantes de lenguas marginadas sin poder disfrutar plenamente de los beneficios relacionados con los derechos que proporciona el acceso a Internet. Se necesita con urgencia la colaboración entre empresas privadas, organismos públicos e iniciativas de la sociedad civil para superar esta brecha lingüística digital.

Internet y las tecnologías digitales asociadas han fomentado innumerables oportunidades para que personas de todo el mundo produzcan, compartan y consuman información e ideas. También reflejan —y en muchos sentidos perpetúan— las mismas desigualdades globales en la producción y el acceso al conocimiento que existían antes de la revolución digital.

Muchos de los fundamentos de la tecnología de las comunicaciones en Internet (como los caracteres Unicode, los teclados QWERTY, los scripts digitales y los lenguajes de software y programación) fueron desarrollados tanto por organismos gubernamentales como por agentes privados de Estados con un considerable poder geopolítico y económico.

Por ello, muchas de esas tecnologías básicas reflejan las opciones de diseño de quienes utilizan lenguas occidentales basadas en el alfabeto romano de izquierda a derecha, y no fueron diseñadas teniendo en cuenta a los hablantes que utilizan alfabetos u ortografías diferentes, con historias de lenguas orales, o con requisitos particulares de accesibilidad. 

Además, a medida que Internet fue adquiriendo un papel más central en nuestro trabajo diario y en nuestra vida privada, estos mismos Estados más ricos pudieron construir las infraestructuras físicas necesarias para el acceso a Internet, dar a sus ciudadanos un acceso relativamente barato a conexiones de banda ancha cada vez más rápidas e incorporar la alfabetización digital y las competencias en TIC a sus sistemas educativos estatales.

Muchas de esas tecnologías básicas reflejan las opciones de diseño de quienes utilizan lenguas occidentales basadas en el alfabeto romano de izquierda a derecha, y no fueron diseñadas teniendo en cuenta a los hablantes que utilizan alfabetos u ortografías diferentes, con historias de lenguas orales, o con requisitos particulares de accesibilidad. 

 

Por lo tanto, los individuos de estos estados han podido históricamente no sólo consumir, sino también contribuir al ecosistema de Internet mucho más que muchos de sus homólogos en países menos desarrollados.

El panorama del acceso a Internet está cambiando. En la actualidad, el 75 % de los 5000 millones de usuarios de Internet proceden del Sur Global.  Sin embargo, a pesar de que estas regiones albergan el 90 % de las más de 7000 lenguas del mundo, la mayoría de las principales plataformas y servicios siguen estando disponibles o funcionando solo en un pequeño número de lenguas dominantes en la geopolítica.

Un reciente informe de Whose Knowledge, The Oxford Internet Institute y el Centre for Internet and Society explora las diferencias lingüísticas en las interfaces de las principales plataformas, en la geografía de Google Maps y en los ecosistemas de conocimiento de Wikipedia. Los investigadores demuestran mediante estos estudios numéricos que incluso las lenguas con decenas o cientos de millones de hablantes están considerablemente infradotadas en cuanto a los tipos y volúmenes de conocimiento disponibles en línea.

Aunque muchos sostienen que la mayoría de los usuarios de Internet hablan una lengua regional o internacional, además de su primera lengua, a través de la cual pueden acceder a la información y expresarse en línea, hay que señalar que esta fluidez requiere una exposición considerable a la lengua en cuestión, ya sea por inmersión o por escolarización. Muchas personas en todo el mundo, sobre todo las más desfavorecidas en otros aspectos, no tienen acceso a ninguna de las dos cosas.

En la actualidad, el 75 % de los 5000 millones de usuarios de Internet proceden del Sur Global.

Además, la ausencia de contenidos digitales en Internet en lenguas marginales suele conllevar la ausencia de los grandes conjuntos de datos lingüísticos necesarios para entrenar las aplicaciones emergentes de procesamiento del lenguaje natural (PLN), como traductores en línea, correctores ortográficos y gramaticales y aplicaciones de texto predictivo, asistentes de voz, resumidores de texto, filtros de palabras clave y chatbots. Estas herramientas de asistencia permiten cada vez más a las personas del mundo desarrollado que utilizan lenguas influyentes ahorrar más tiempo y dinero, y también están sirviendo como herramientas vitales en la lucha contra los contenidos nocivos e ilegales en las plataformas en línea.

 

Sin embargo, tanto las herramientas como las bases de datos necesarias no existen para quienes ya se están quedando “atrás” de muchas otras maneras. A medida que estas brechas tecnológicas siguen ampliándose, incluso los costos invisibles de las herramientas automatizadas en inglés, cada vez más avanzadas, serán probablemente soportados por quienes tienen menos probabilidades de beneficiarse de ellas.

 

Estas marcadas desigualdades en los contenidos, servicios y sistemas de moderación disponibles para las comunidades lingüísticas marginadas están cada vez más en el punto de mira de las instituciones internacionales. Instrumentos internacionales como la Declaración sobre las Minorías y la Declaración sobre los Derechos de los Pueblos Indígenas han hecho hincapié en las obligaciones positivas de los Estados de proteger y promover las culturas y lenguas marginadas, incluso mediante la educación y el desarrollo tecnológico.

 

El Plan de Acción Mundial de la UNESCO sobre el Decenio Internacional de las Lenguas Indígenas incluye objetivos relacionados con la creación de infraestructuras digitales y conjuntos de datos para las lenguas marginadas. Y el equipo B-Tech de la OACDH está estudiando cómo se aplican los Principios Rectores de las Naciones Unidas para las Empresas y los Derechos Humanos a las empresas tecnológicas y su obligación de considerar cómo sus productos pueden afectar especialmente a los derechos de los grupos marginados, o exacerbar la discriminación o contribuir a los daños físicos.

 

Sin embargo, las diferencias entre las normas y su aplicación son considerables. Muchos Estados con diversidad lingüística tienen recursos y fondos limitados para alcanzar estos objetivos, y muchas plataformas en línea con influencia mundial y presupuestos multimillonarios gastan recursos sólo en lenguas y tecnologías lingüísticas de importancia comercial estratégica.

Tanto las empresas tecnológicas privadas como los gobiernos tienen la responsabilidad de proteger los derechos de las minorías y garantizar que los hablantes de lenguas marginadas tengan el mismo acceso a los derechos que permiten las tecnologías digitales y de internet.

Por ello, las empresas que facilitan la información y el intercambio de contenidos en línea deben invertir en el desarrollo de infraestructuras e interfaces digitales sólidas para todas las lenguas de su base de usuarios, y ofrecer vías para la creación y conservación de contenidos en las lenguas locales cuando sea necesario. Esto podría incluir el apoyo y la colaboración con iniciativas de digitalización de lenguas dirigidas y potenciadas por expertos locales, como el proyecto Open Speaks de la Fundación O, que dota a los activistas lingüísticos de las herramientas y los marcos necesarios para la documentación audiovisual exhaustiva de sus lenguas, o la aplicación Living Dictionaries del Living Tongues Institute for Endangered Languages, que recopila léxicos digitales con capacidad de búsqueda de lenguas en peligro de extinción de todo el mundo.

A nivel estatal, es evidente la necesidad de financiar y dotar de recursos la recopilación de datos y literatura en lenguas marginadas para garantizar su supervivencia y sentar las bases para el desarrollo de tecnologías lingüísticas adecuadas. La mejora y ampliación de la enseñanza de las TIC para quienes hablan lenguas marginadas también será de vital importancia, y la asociación con empresas de traducción podría ayudar a avanzar en este sentido.

A largo plazo, las hojas de ruta digitales (tanto nacionales como internacionales) deberían reconocer y abordar explícitamente las necesidades específicas de las comunidades lingüísticas marginadas para acceder y disfrutar de sus derechos en línea.