2.3 Representación de las lenguas de signos
Dentro del ámbito de las ciencias de la computación y la lingüística, existe una marcada inclinación hacia la búsqueda de mecanismos estructurados para representar la información. En el contexto de las lenguas orales, modelos como los árboles de análisis sintáctico y las gramáticas formales gozan de amplia aceptación y uso. Estos enfoques, por lo general, ponen un especial énfasis en aspectos como la sintaxis y la semántica. Sin embargo, su aplicabilidad no se limita a estos niveles, sino que puede extenderse para abarcar también la morfología (Aronoff 1993) y la fonología, tal como se manifiesta en modelos como la fonología autosegmental (Goldsmith 1976). Este enfoque es también válido para las LS, y en la siguiente sección veremos varias representaciones emmarcadas en este paradigma. En 2.3.2, sin embargo, pasaremos a un modelo completamente distinto: la SignoEscritura.
2.3.1 Representaciones fonológicas estructuradas
Dada la intrincada naturaleza fonológica de las lenguas de signos, los modelos estructurales diseñados para describirlas tienden a enfocarse predominantemente en aspectos fonológicos. Uno de estos sistemas, denominado “AZee” (Filhol y Braffort 2007; Hadjadj, Filhol, y Braffort 2018) y diseñado específicamente para la LSF, propone un formalismo altamente computacional que se centra en la ejecución precisa de los signos. Gracias a esto, permite un amplio procesamiento computacional, incluyendo la generación de avatares signantes que ostentan un alto nivel de expresividad y corrección (Filhol, McDonald, y Wolfe 2017).
Otros modelos adoptan un enfoque más parecido a la descripción QOLDF detallada en la sección anterior, concentrándose en los parámetros fonológicos del signo. Stokoe (1960), en su descripción lingüística fundacional de la ASL, diseñó un sistema de notación en el cual diferentes símbolos representan distintos valores para cada rasgo fonológico. Estos símbolos se concatenan en un orden específico, generando aparentemente una estructura lineal similar a la escritura en las lenguas orales. No obstante, es crucial reconocer que los parámetros de los signos ocurren de forma simultánea en la realidad, haciendo que su ordenación secuencial sea simplemente arbitraria y aparente.
Construyendo sobre este mismo principio de secuenciación, el sistema de notación de Hamburgo (HamNoSys, Hanke 2004) aumenta el inventario de símbolos disponibles y refina la descripción lingüística subyacente. HamNoSys aspira a incorporar una gama más amplia de características de las lenguas de signos, incluidas aquellas que son específicas de lenguas de signos distintas de la ASL, particularmente la Lengua de Signos Alemana (Deutsche Gebärdensprache, DGS). Diseñado con la era digital en mente, HamNoSys suele codificarse en XML, reflejando claramente su naturaleza estructurada. La tabla 2.1 ofrece una comparativa entre HamNoSys, la notación de Stokoe y la SignoEscritura, de la cual hablaremos más adelante.
Notación de Stokoe | HamNoSys | SignoEscritura | |
---|---|---|---|
Tres | 3\(^{\mbox{f}}\) | ||
Osos | [jC\(^{\mbox{+}}\)jC\(^{\mbox{v}•}_{\mbox{x}}\) | ||
Rizitos de oro | cY\(^{\mbox{@}}_{\mbox{v}}\) | ||
Bosque profundo | \(\overline{\mbox{B}}_{\mbox{a}}\)jB\(_{\mbox{\^{}}}\)\(^{\mbox{w}}_{\mbox{>}}\) |
En España, Herrero Blanco (2003) introdujo un sistema de escritura alfabética (SEA) que emplea los caracteres latinos convencionales, asignando a cada uno o a combinaciones de ellos los distintos posibles valores de los rasgos de la LSE.
Similares al SEA, han ido surgiendo otros sistemas que utilizan caracteres latinos, facilitando su entrada a través de un teclado convencional y haciéndolos más accesibles para el público en general. Este es el caso del modelo propuesto por Eccarius y Brentari (2008), que se enfoca exclusivamente en representar la configuración de la mano, y de nuestro propio sistema, denominado “Signotación,” que fue presentado en la Sociedad Española de Lingüística (Lahoz-Bengoechea y Sevilla 2022b). Además de los caracteres latinos, la “Signotación” incorpora también números y símbolos ASCII, fácilmente accesibles en un teclado habitual, y se fundamenta en un modelo fonológico de nueva creación. Una implementación práctica de este sistema se puede ver en el Signario2 (Lahoz-Bengoechea y Sevilla 2022a), donde se utiliza como representación subyacente para almacenar y recuperar signos de la LSE.
La ventaja intrínseca de los sistemas estructurados radica en su capacidad para capturar la información semántica y sintáctica que está implícita en la lengua, más allá de su manifestación superficial. Estos sistemas habilitan un procesamiento computacional altamente eficiente y robusto, dado que la estructura de la lengua se encuentra ya codificada en la representación.
Sin embargo, las representaciones estructuradas también albergan diversas desventajas. En primer lugar, están basadas en un paradigma lingüístico concreto, que podría resultar inexacto o insuficientemente preciso para capturar todas las complejidades de la lengua. Esto es especialmente problemático en el contexto de las lenguas de signos, en el que no existe un marco teórico unánimemente aceptado o suficientemente exhaustivo. En segundo lugar, tales representaciones tienden a ser altamente académicas y técnicas, lo que dificulta su uso y comprensión por parte de la población general. Esta limitación reduce su aplicabilidad a contextos y circunstancias específicos, restringiendo así la diversidad de datos potencialmente disponibles y su representatividad en los distintos registros de la lengua. Además, cualquier signante que desee contribuir como informante tendría primero que ser instruido tanto en el paradigma lingüístico subyacente como en el uso específico del sistema de transcripción.
2.3.2 SignoEscritura
Contrastando con las representaciones estructuradas, en las lenguas orales la escritura constituye la modalidad más convencional que los hablantes emplean para representar su idioma. Esta tecnología, que frecuentemente se da por sentada pero que representa uno de los inventos más significativos de la historia humana, consiste en transcribir la manifestación superficial (sonidos) del lenguaje en símbolos abstractos, como letras, jeroglíficos o ideogramas3.
Los sistemas de escritura descansan en gran medida sobre la intuición lingüística del lector, dado que no codifican de forma explícita ni el significado ni la gramática inherente a la lengua. Aunque esto puede considerarse una desventaja desde la perspectiva del procesamiento computacional, ofrece el beneficio de capturar la lengua en su estado más puro y natural. Al no estar vinculada a un modelo lingüístico específico, la escritura permite una mayor flexibilidad y variabilidad en la representación del lenguaje. Para el hablante nativo, utilizar su propia representación mental del lenguaje no constituye una dificultad, y por otro lado no requiere aprender un modelo formal más complicado y académico.
En el caso de las lenguas de signos, existe un modelo que comparte estas características: la SignoEscritura (SignWriting, Sutton 1995).
La SignoEscritura ofrece una transcripción gráfica y altamente visual de las LS, capturando las configuraciones y movimientos tal y como “se ven”. Se utilizan símbolos abstractos pero icónicos para representar las manos y otras partes del cuerpo, mientras que las flechas sirven para indicar la dirección del movimiento. Cada uno de estos símbolos, que denominaremos “grafemas”, se dispone bidimensionalmente sobre la página para simular el espacio de signado. Designamos como “logograma” a la imagen conformada por los grafemas, que habitualmente se corresponde con un signo individual, palabra o morfema. En la figura 2.4 se pueden observar varios ejemplos, así como sus grafemas constituyentes.
Para representar la orientación de la mano, los grafemas correspondientes pueden rotarse y colorearse de diversas maneras, tal como se muestra en la figura 2.5. El lugar de articulación se indica situando los grafemas en posiciones relativas bidimensionales que equivalen a sus posiciones tridimensionales relativas en el espacio. Asimismo, se emplean distintas formas icónicas para representar la configuración de los dedos, y otros grafemas adicionales que pueden marcar contactos, relaciones dinámicas entre ambas manos, y otros aspectos. La representación de la cara y el cuerpo también se realiza mediante grafemas que son tanto etimológicamente transparentes como fáciles de comprender, aunque permanecen abstractos y arbitrarios.
La SignoEscritura es intrínsecamente fonética, pues transcribe la lengua tal y como se presenta, sin codificar ningún modelo fonológico o gramatical subyacente. Es un sistema independiente de cualquier LS concreta (aunque para transcribirlas todas se ha necesitado realizar algunas extensiones). Su carácter visual facilita tanto su producción como su interpretación, incluso para aquellos únicamente con formación básica en el uso del sistema (Di Renzo et al. 2006). Por estas razones, la SignoEscritura se erige como un sistema ideal para la creación de corpus de datos, recursos léxicos y como una forma efectiva de transcribir la LS para su registro y preservación (Sutton y Frost 2008; Galea 2014).
Sin embargo, dada la naturaleza compleja y expresiva de las LS y la aspiración internacional de la SignoEscritura, este sistema es intrincado y extenso. Para una comprensión más detallada, se pueden consultar los capítulos 6 y 7, o las Lecciones de SignoEscritura disponibles de manera gratuita en múltiples idiomas, incluido el español (Sutton 1995). Como ilustración de su uso, la figura 2.6 ofrece una transcripción en SignoEscritura de las oraciones de la figura 2.1.
Y a pesar de las ventajas mencionadas, el aspecto gráfico y visual de la SignoEscritura presenta desafíos para su tratamiento computacional. En la lingüística computacional, una de las piedras angulares es la representación de la lengua como “cadena de caracteres”, un formato lineal e intrínsecamente incompatible con la naturaleza bidimensional de la SignoEscritura. Existen esfuerzos para codificar esta como texto plano (Sutton y Slevinski 2010; Slevinski 2016), pero no resuelven el problema fundamental de su bidimensionalidad y simultaneidad. Además, difieren significativamente de las nociones convencionales de “carácter” y “palabra” en las lenguas orales, lo que impide en cualquier caso su uso directo en algoritmos convencionales de procesamiento del lenguaje.
Por lo tanto, si queremos explotar plenamente el potencial de la SignoEscritura como sistema para representar y procesar las LS, resulta imprescindible optimizar su tratamiento computacional. Abordar este obstáculo es la meta del objetivo técnico de esta tesis, que es abordado en profundidad en el capítulo siguiente así como en las publicaciones relacionadas.