4 Conclusiones
El objetivo general de esta tesis consistía en explorar y desarrollar avances en el tratamiento computacional de las lenguas de signos, con un enfoque particular en la Lengua de Signos Española, mediante la aplicación de técnicas modernas de IA, LC y PLN.
En aras de alcanzar este objetivo, se planteó inicialmente una meta teórica consistente en el análisis profundo de la lengua de signos. Esto implicaba no solo un estudio del estado actual del campo, sino también un entendimiento exhaustivo de la LSE y su uso como lengua natural. A este respecto, realicé estudios formales de LSE en el Centro Superior de Idiomas Modernos (CSIM) de la Universidad Complutense, alcanzando el nivel C2 dentro del Marco Común Europeo de Referencia para las Lenguas.
El estudio riguroso de la lengua y la interacción con la comunidad sorda han contribuido de manera invaluable no solo a mi investigación y a la elaboración de esta tesis, sino también a mi desarrollo integral como profesional en la intersección de la informática, la lingüística computacional y como individuo. Mi experiencia en el aprendizaje y análisis de la LSE ha reconfigurado significativamente mi perspectiva sobre la naturaleza del lenguaje, el pensamiento humano y la inteligencia artificial. Mi profundización en la gramática y en las características únicas de la LSE no solo ha ampliado mi conocimiento lingüístico, sino que también ha establecido un sólido fundamento para futuros desarrollos en el campo, permitiéndome adaptar las técnicas de LC y PLN a las particularidades de las lenguas de signos.
Entre los logros específicos derivados del análisis teórico, cabe destacar la publicación de varios artículos académicos más allá de los incluidos en el compendio. En Sevilla y Lahoz-Bengoechea (2019), publicado en la revista de la Sociedad Española de Procesamiento del Lenguaje Natural, abordamos un estudio sobre la característica fonológica de la orientación en las lenguas de signos, resaltando sus implicaciones sintácticas. Otro trabajo relevante es Lahoz-Bengoechea y Sevilla (2022b), presentado en el congreso de la Asociación Española de Lingüística Aplicada, en el que introducimos la “Signotación”, una representación fonológica de la LSE que no solo ofrece utilidad lingüística, sino que también sirve como base para numerosos enfoques computacionales para el procesamiento de la LSE.
Adicionalmente, diseñé el esquema de anotación del corpus VisSE, que está lingüísticamente fundamentado y emplea en algunos casos la Signotación para capturar características específicas de la LSE. Este esquema de anotación, resultado del análisis teórico, contribuye también de manera significativa a la realización de los objetivos posteriores.
Un hallazgo crucial del análisis teórico fue la identificación del desafío asociado a la representación de la LSE, que representa un obstáculo fundamental para su tratamiento computacional. Este descubrimiento condujo al objetivo técnico de la tesis: avanzar en el procesamiento de la SignoEscritura. Para abordar este desafío, se inició el proyecto VisSE1, cuyo propósito era desarrollar herramientas que facilitasen el uso de SignoEscritura en entornos digitales.
Para abordar el objetivo técnico principal, se establecieron tres sub-objetivos específicos. El primero de estos sub-objetivos respondía a la necesidad imperante de trabajar con un volumen suficiente de datos. Esta necesidad era doble: por un lado, se pretendía adoptar una aproximación empírica al estudio, y por otro, se quería emplear técnicas de IA modernas, que requieren de conjuntos de datos significativos para su entrenamiento efectivo. En respuesta a este primer sub-objetivo, se recopilaron más de 2000 muestras de SignoEscritura, de las cuales 982 fueron cuidadosamente anotadas y organizadas en el corpus VisSE. Aunque la anotación manual de todas las muestras recopiladas resultó ser una tarea demasiado ardua para completar en el marco temporal del proyecto, se han sentado las bases para futuras anotaciones que permitirán ampliar el corpus en futuras revisiones.
El segundo sub-objetivo técnico se centraba en el uso de técnicas de IA para el reconocimiento y la comprensión de la SignoEscritura. Gracias al conjunto de datos previamente recopilado, se entrenaron algoritmos de aprendizaje automático que lograron reconocer los grafemas en nuevas instancias de SignoEscritura con un acierto del 68%. Este nivel de acierto supera al que se podría haber alcanzado mediante el uso de un único algoritmo de aprendizaje automático. Para lograrlo, se diseñó un sistema experto que combina diversas redes neuronales junto con reglas lógicas de procesamiento, aumentando así tanto la precisión como la robustez de nuestro sistema, en una metodología novedosa que constituye otra de las aportaciones principales de la tesis. A pesar de estos avances, aún queda margen para mejorar. Por una parte, la tasa de acierto global es susceptible de mejora, aunque la sección 8.6 presenta una discusión más optimista al respecto. Por otra parte, la comprensión completa de la SignoEscritura también implica entender el significado composicional de los logogramas, emergente de su combinación sintáctica más allá de sus propiedades léxicas. Esta tarea, no obstante, se presenta como un reto para futuras investigaciones.
El tercer y último sub-objetivo técnico se orientaba hacia la materialización de los resultados obtenidos a través del desarrollo de software. El principal logro en este ámbito es la creación de Quevedo, una librería y aplicación en Python que codifica de forma reproducible y utilizable el conocimiento experto adquirido. Esta herramienta no solo posibilita el procesamiento de nuestra colección de SignoEscritura o de nuevas muestras que puedan ser recopiladas, sino que también permite replicar nuestra investigación con otros conjuntos de datos o incluso adaptarla a otros “lenguajes gráficos”, una posibilidad que descubrimos gracias a la metodología usada de abstracción y generalización de procesos y teorías.
Además, el proyecto VisSE tenía como meta la creación de herramientas que pudieran ser transferidas a aplicaciones útiles para los usuarios. Este objetivo responde no solo al tercer sub-objetivo técnico relativo al desarrollo de software, sino también al objetivo social más amplio del proyecto. La principal herramienta desarrollada en este sentido es una aplicación web que permite a los usuarios entender los distintos grafemas de la SignoEscritura y su significado en nuevas muestras enviadas. Asimismo, se creó un modelo de mano en 3D que es capaz de articular la fonología configuracional de la LSE, y que ha sido integrado en la aplicación para proporcionar una representación visual, además de textual, del significado de los grafemas. Este proyecto, por tanto, no solo ha avanzado en el ámbito técnico del procesamiento lingüístico de SignoEscritura, cumpliendo con nuestros objetivos académicos y científicos, sino que también ha hecho contribuciones tangibles a la sociedad.
Finalmente, me había planteado como objetivo complementario el preparar tanto los datos como el software desarrollado de una forma estandarizada y formalizada. Estos han sido publicados en línea y bajo licencias abiertas con el fin de facilitar su utilización por otros investigadores y desarrolladores. Todo el software desarrollado se encuentra accesible en GitHub, incluyendo el sistema experto para el reconocimiento de SignoEscritura. Los datos recopilados se han organizado meticulosamente en un corpus que, adicionalmente, incluye una exhaustiva guía de anotación tanto en inglés como en español. Todo este conjunto de recursos se halla disponible en línea, así como los pesos de las redes neuronales que hemos entrenado. Los distintos resultados obtenidos a lo largo de esta investigación, así como otros desarrollos de menor envergadura que no son objeto de esta discusión para evitar dilatarnos innecesariamente, se detallan en el apéndice A.