Palabras con mucha inteligencia… artificial
¿Quieres asegurarte de si una palabra existe en español? ¿Y si, en tal caso, está bien escrita en base a su categoría gramatical? O quizás necesites descomponerla en sílabas, y conocer cuáles son las sílabas tónicas o si cuenta con algún diptongo o hiato… ¿Y si necesitas transcribir a texto algún número ordinal, cardinal, fraccionario o incluso número romano?. Todo esto y más lo resuelve el proyecto web Tulengua.es
La Inteligencia Artificial se está afianzando como un extraordinario aliado de las disciplinas humanísticas en este principio del siglo XXI. Así, expertos de la Informática, como los profesores e investigadores de la ULPGC Francisco Javier Carreras, Gustavo Rodríguez y Zenón Hernández, se han convertido en auténtico ‘oro molido’ para los investigadores de las Humanidades, gracias al trabajo que realizan en torno al tratamiento automático de la Lengua Española. Su proyecto web Tulengua.es es un rotundo éxito internacional, con más de 40.000 usuarios diarios de todo el mundo.
Los tres profesores e investigadores informáticos de la ULPGC integran la División de Lingüística Computacional del Instituto Universitario de Análisis y Aplicaciones Textuales (IATEXT) de la ULPGC, formando un equipo multidisciplinar de trabajo con compañeros de las ramas humanísticas para ofrecer soluciones automatizadas a través de la inteligencia Artificial a la Lengua Española. “Nos centramos en procesar el lenguaje natural, que es lo más parecido a lo que se denomina Lingüística Computacional”, explica el profesor Francisco Javier Carreras. Y es que, como él mismo destaca, en la actualidad “no es posible entender una máquina con Inteligencia Artificial si no es capaz de comunicarse con los humanos”.
De los trabajos que desarrollan él y sus compañeros surge, desde hace dos años, el proyecto web Tulengua.es, que es el ejemplo perfecto de lo que promueve y acoge el IATEXT de la ULPGC: buscar posibles aplicaciones y soluciones a la investigación humanística a través de la Inteligencia Artificial. TuLengua.es nace a partir de resultados de la investigación científica, y este es el principal aspecto a destacar frente a otras webs parecidas que surgen en internet y que pueden no resultar tan fiables. “Las aplicaciones de esta web tienen un nivel de detalle exhaustivo, para conseguirlo usa complejos algoritmos de tratamiento lingüístico y una base de datos morfo-léxica de más de 6 millones de palabras flexionadas o conjugadas a partir de unas 230.000 formas canónicas”. Un auténtico tesoro lingüístico que es posible consultar en tiempo real gracias a los programas informáticos desarrollados por la División de Lingüística Computacional del IATEXT, para ofrecer al usuario toda la información, formación y las distintas funcionalidades que nos sugieren las palabras españolas.
Así, la web cuenta con varias aplicaciones de gran interés, a tenor de los datos de sus visitantes diarios, que acceden desde todos los países del mundo: más de 40.000 usuarios al día, que realizan más de 250.000 consultas, según las estadísticas que ofrece Google Analytics.
Entre las aplicaciones más demandadas de TuLengua.es figura el buscador de palabras, denominado Palabras TIP, que permite acceder a más de 1,8 millones de palabras del léxico español, e informarse de sus atributos, categorías gramaticales, denominación y frecuencia de uso; además, muy útil para conocidos juegos como Apalabrados o Scrabble. También es muy demandada la sección de conjugación de verbos y su morfología, Conjugador TIP, el corrector ortográfico o la aplicación denominada Silabeador TIP, que realiza la separación de cualquier palabra española e informa de cuál es la sílaba tónica y átona, si cuenta con diptongos, hiatos o triptongos, si está compuesta por algún prefijo o pronombre enclítico, etc. Recientemente han publicado una versión extendida del Silabeador, Sílaba Tónica TIP, que detecta todas las posibles sílabas tónicas de una palabra, en donde el usuario puede comprobar las opciones correctas de escritura.
Convertidor de números
Otra de las grandes novedades de la web Tulengua.es también ha sido el convertidor de números a texto Números TIP, con ejemplos que permiten al usuario hacer un uso exacto de ellos, ya sean números ordinales, cardinales, fraccionarios, multiplicativos e, incluso, números romanos. Una aplicación que los propios investigadores de la ULPGC han constatado que es de gran utilidad para el sector bancario, sin ir más lejos, pues también permite convertir las cantidades a letras en euros, dólares o pesos, “para reflejarlas en cheques bancarios o en documentos oficiales”.
Es tal el éxito obtenido por estas aplicaciones que la web se sitúa entre las primeras posiciones del buscador de Google cuando se intenta resolver una pregunta directa sobre gramática o lingüística española. No hay más que hacer en Google la siguiente consulta: “dividir en sílabas la palabra pandemia”. Y se puede comprobar cómo Tulengua.es es la primera opción para salir de dudas, tras desplegarse los resultados de la búsqueda.
Los tres profesores de Informática de la ULPGC, que han participado, además, en otros proyectos de investigación relevantes como la BDME TIP, Excerpta y OPORT, continúan trabajando diariamente en el perfeccionamiento de esta web, que nace del fruto de la investigación constante y que se ha posicionado como un recurso fundamental en el campo de la enseñanza y formación lingüística del mundo hispanohablante, y del resto de países. Su éxito pone en valor el trabajo que se desarrolla en el IATEXT, un instituto de investigación universitaria que ya es referencia internacional en las Humanidades Digitales.