Se acaba de presentar el ambicioso proyecto de la Real Academia Española de la Lengua (RAE) en conjunto con Amazon Web Services (AWS) que consta de una herramienta de Inteligencia Artificial para el estudio del idioma español en internet. En los últimos años, la RAE ha sido cuestionada por fomentar el uso formal de la lengua dejando de lado formas menos académicas a pesar de que estas últimas son utilizadas por millones de personas; si bien la Academia siempre se ha referido a sus preferencias como “recomendaciones”, la comunidad (sobre todo en redes) refieren a dichas recomendaciones como leyes inamovibles desvirtuando el espíritu fundamental de la institución que es la de recoger y registrar el cómo usamos los hispanohablantes nuestro idioma, el hecho de que quienes hablamos esta lengua somos los dueños de la misma y la vamos transformando.
Este proyecto está en vías de procesar 8.7 millones de documentos publicados en todo el mundo, en español, por supuesto, que van desde textos en redes sociales, documentos administrativos, académicos o científicos, por mencionar algunos.
La cantidad de archivos pueden parecer pocos si tomamos en cuenta el número de hispanohablantes y la cantidad bestial de textos que se generan en internet todos los días, pero si los comparamos con los que cuenta la Wikipedia al día de hoy, 1.5 millones, podemos afirmar que son suficientes para comenzar un proyecto serio. Los textos serán procesados y sometidos a preguntas concretas, por ejemplo: ¿Cuántos extranjerismos utilizamos por cada cien palabras en los países hispanoamericanos? ¿Cuántos errores sintácticos están contenidos en esos textos? ¿Qué tanta es la dificultad para entender leyes? ¿Se escribe hoy de manera más precisa, en la prensa, en comparación con el año 2000? ¿Qué normas propuestas por la Academia son más problemáticas en vista de su incumplimiento? Esto con la intención de tener mayor claridad acerca de la riqueza léxica y variedad de palabras utilizadas por usuarios de redes, periodistas, legisladores, etc.
Qué tanto se están siguiendo las normas y qué tanto están influyendo otros idiomas en el nuestro; al final, los académicos podrán tomar mejores decisiones (¿más flexibles?) con base en estadísticas precisas gracias al uso de la tecnología. El director de la RAE, Santiago Muñoz Machado, afirmó que estamos en un momento “refundacional… la RAE siempre trabajó en averiguar cómo evoluciona el español mediante trabajos de lectura, con fichas a mano que nos han ayudado a crear las normas. Ahora nos pertrechamos de las herramientas que la tecnología nos ofrece…”. Las búsquedas serán más precisas y sofisticadas, las normas más acordes al panorama general, inmediato, de cómo usamos la lengua. La Academia está en vías de convertirse, a partir de ahora, en un centro de instigación técnico-científica y no sólo en un club de rectores. ¿Será la puerta de entrada al reconocimiento del leguaje inclusivo? ¿Le daremos la vuelta al desprecio o minimización del uso particular del lenguaje por parte de comunidades específicas y colectivos? ¿Jugará la RAE de manera más pasiva y flexible como lo hacen otras academias en el mundo? No lo sabemos, pero todo apunta a una inevitable renovación producto de los tiempos que corren y en los que la Academia parecía que no tenía prisa por alcanzarnos.