Resumen
Las lenguas de signos son lenguas naturales propias de las comunidades de personas sordas o con déficit auditivo. No son meras transposiciones de la lengua oral, sino que tienen origen y evolución propias, así como su propio léxico, gramática e idiosincrasia.
Esto las convierte en un objeto de estudio legítimo para los campos de la Lingüística Computacional y el Procesamiento del Lenguaje Natural. En esta tesis se describe una investigación enmarcada en este estudio, con énfasis en la Lengua de Signos Española (LSE) y su SignoEscritura. La investigación doctoral realizada se articula en seis publicaciones, elaboradas en el marco de un proyecto de investigación financiado, dirigido por el autor y de título “Visualizando la SignoEscritura” (VisSE).
Se incluye una discusión integradora que establece y justifica los objetivos de la investigación. Se realiza además un análisis crítico del estado de la cuestión, en el que se consideran aspectos fundamentales para la investigación en lenguas de signos, como los métodos para su reconocimiento automático, su gramática y estructura, y su representación escrita. Es precisamente este último tema el que motiva el principal objetivo técnico de la tesis: mejorar el procesamiento automático de la SignoEscritura.
En este marco, se ha recolectado un corpus original de muestras de SignoEscritura de LSE, para el que se ha desarrollado un esquema de anotación novedoso y complejo basado en el conocimiento de su lingüística. En base a este corpus se han entrenado algoritmos de Inteligencia Artificial, en concreto redes neuronales de aprendizaje profundo, para reconocer e interpretar la SignoEscritura. La eficacia de estos algoritmos se ha potenciado mediante la creación de un sistema experto que los combina con reglas lógicas, deducidas del análisis teórico realizado. Estos desarrollos han sido posibles gracias a una librería Python creada para esta investigación, Quevedo, que permite gestionar corpus de datos, visualizarlos, anotarlos y procesarlos. También se ha creado una aplicación web para transferir a la sociedad los resultados obtenidos que convierte la SignoEscritura en explicaciones textuales y en un modelo tridimensional de la mano.
Adicionalmente, esta tesis no sólo ha aportado avances técnicos en el procesamiento de la SignoEscritura, sino que también ha generado un conocimiento profundo sobre la LSE, materializado en un modelo subyacente y en diversas publicaciones y aplicaciones computacionales no incluidas en el compendio pero referenciadas en este documento.
El software y los datos generados durante la investigación han sido liberados bajo licencias de código abierto, permitiendo así que futuros investigadores puedan continuar avanzando en este ámbito sin tener que partir desde cero.