Nuevos idiomas que llegan a traductor Google | Señal Memoria

El quechua, el aymara
Publicado el Mié, 06/07/2022 - 09:52
El quechua, el aymara y el guaraní llegan al traductor de Google

En la conferencia Google I/O se anunció que veinticuatro nuevos idiomas se incorporan al traductor de Google, para un total de 132 lenguas. En total, las nuevas lenguas tienen 300 millones de hablantes alrededor del mundo. Entre ellas hay lenguas indígenas como el quechua, el aymara y el guaraní. Desde la Conquista de América lo indígena ha sido visto como señal de atraso frente al progreso europeo y del norte global. Así las cosas, la incorporación de tales idiomas al traductor les confiere visibilidad y los reivindica, así como a sus millones de hablantes.

Cada año, en Mountain View, California (Estados Unidos), Google realiza su famosa conferencia Google I/O para mostrar los avances en innovación del gigante tecnológico. En la conferencia de 2022 presentó un nuevo smartphone y sus recientes audífonos. También, y ese es el tema que nos convoca hoy, Google anunció que su traductor añadiría 24 idiomas nuevos a su soporte, para llegar a un total de 132. En un comunicado, los ejecutivos de Google afirmaron que:

"la meta era incluir lenguas subrepresentadas para conectar a las comunidades de todo el mundo. Para lograrlo fue fundamental el trabajo del buscador con hablantes nativos, profesores y lingüistas"

Estos son los 24 idiomas nuevos que hacen parte del traductor de Google: assamese, aymara, bambara, bhojpuri, dhivehi, dogri, ewe, guaraní, ilocano, konkani, krio, lingala, luganda, maithili, meiteilon (manipuri), mizo, oromo, quechua, sanskrit, sepedi, kurdish (sorani), tigrinya, tsonga y twi. Que su desconocimiento no se confunda con falta de importancia: en esa lista encontramos idiomas como el lingala, de África central, hablado por más de 45 millones de personas, y el mizo, del noroeste de la India, por casi un millón. 

En total, los nuevos idiomas hacen parte de la vida de 300 millones de individuos alrededor del mundo. De ahí que sea un error pensar que estas lenguas son poco relevantes frente a las que ya existían en el arsenal del traductor. Después de todo, idiomas europeos como el sueco, el finlandés y el catalán cuentan con muchos menos hablantes nativos, aunque hace años hacían parte del traductor de Google. No es casualidad que fueran lenguas del norte global y que las nuevas provengan del sur.  

Su incorporación se realizó a través de una nueva función de aprendizaje automático del traductor de Google, llamada Zero Shot. Antes, el sistema de aprendizaje automático del traductor podía dominar otro idioma solo a partir de ver traducciones que lo incorporan, pero con Zero Shot y dada la experiencia acumulada, está en capacidad de traducir un nuevo idioma solamente a partir de un texto en dicho idioma. Isaac Caswell, investigador científico del traductor, dijo al New York Times que era como un políglota encerrado en una habitación con nada más que una pila de libros en un nuevo idioma: con el tiempo suficiente, el políglota resuelve el problema. Sin duda, se trata de un hito técnico para Google.

En la lista de nuevos idiomas podemos identificar algunas lenguas indígenas de América, como el guaraní, el aymara y el quechua. El programa Sopa de letras, del Archivo Señal Memoria, presentó una rápida introducción a las mismas. 

Castaño, Víctor (2003). Sopa de letras [Lenguas indígenas]. Bogotá: Inravisión - Señal Colombia. Archivo Señal Memoria, BTCX30 010664.

Igualmente, el programa Mitos, leyendas y poesía presentó la cosmogonía guaraní y su origen. 

Brausin, Dora (2004). Mitos, leyendas y poesía [Cosmogonía guaraní]. Bogotá: Radiodifusora Nacional de Colombia. Archivo Señal Memoria, RDNC-DGW-015430-01. 

Desde 1492 lo indígena ha sido visto en el continente como algo atrasado frente a la civilización europea. Más recientemente, con los procesos de migración urbana del siglo XX que consolidaron las grandes ciudades latinoamericanas, las lenguas indígenas quedaron relegadas a reductos rurales y asumidas como lo opuesto al progreso que prometía la migración. En esta historia hay racismo, clasismo y colonialismo, mezclados en un gran batido de rechazo a idiomas que hacen parte de nuestra historia. Por eso es un gran triunfo que el traductor de Google las incorpore. Les da visibilidad y las reivindica junto a sus millones de hablantes.

La utilidad práctica de la inclusión de estos idiomas indígenas de América al traductor de Google es inmediata: los funcionarios públicos pueden llegar a más lugares, sean profesores, agentes de salud o policías. La relación de las comunidades indígenas con el Estado y el resto de su nación puede fortalecerse. Y aunque la incorporación de dichas lenguas todavía es incompleta —por ahora solo está disponible la traducción textual, el sonido está por venir—, las personas que hablan quechua, aymara y guaraní ahora pueden traducir distintos textos y acercarse a muchas fuentes de conocimiento que no se encontraban a su alcance. El proceso también tiene que ver con esfuerzos de activistas digitales encaminados a consolidar la presencia de lenguas indígenas en internet. |

El caso del quechua es particularmente importante dada su historia, pues era el idioma del Imperio Inca, que se extendía desde Colombia hasta Argentina. Surgió hace 1.500 años en los Andes peruanos y fue prohibido por la Corona española luego de la avanzada revolucionaria de Túpac Amaru II en el siglo XVIII. En los años ochenta sufrió el estigma al ser injustamente considerada la lengua del terrorismo, debido al origen de la guerrilla peruana Sendero Luminoso. Tal apreciación ignoraba que los quechuahablantes fueron buena parte de las víctimas del conflicto interno. Hoy se calcula que hay diez millones de personas que hablan quechua en la región, sobre todo en la zona andina.  Acciones como la inclusión del quechua en el traductor de Google abren la posibilidad de establecer otro tipo de relación entre la nación, sus lenguas, su historia y su identidad.

El agregado cultural de la embajada peruana, Hernando Torres, explica parte de este contexto en el programa Vamos a cine y hablamos. 

Laurens, Mauricio (2013). Vamos a cine y hablamos [La teta asustada]. Bogotá : RTVC Sistema de Medios Públicos. Archivo Señal Memoria, DV-262033 CLIP 1.


Por: Santiago Cembrano

Fecha de publicación original Mié, 06/07/2022 - 09:52