La lección amarga sólo es amarga si uno es reduccionista

La “lección amarga” de la ciencia de datos estipula que métodos generales que escalan con cómputo acaban venciendo a los sistemas que incorporan conocimiento humano. En el entorno actual de datos masivos, una lectura habitual es que por muy elegante, parsimonioso y explicativo que sea un sistema predictivo, al final será “vencido” por un sistema más prosaico basado en estadística cuando este último simplemente tenga suficiente cantidad de datos. Es una visión extraída del progreso reciente, donde el aprendizaje automático y métodos estadísticos han demostrado una y otra vez tener mayor capacidad predictiva que sistemas basados en conocimiento y análisis motivado por la teoría.

Aunque esto es esencialmente un resultado relevante para la ciencia de datos e informática, con la revolución actual de la inteligencia artificial generativa empieza a rozar cuestiones más incómodas, casi ontológicas. ¿Qué quiere decir que “máquinas estadísticas” hablen mejor, traduzcan mejor, vean mejor, que algoritmos basados en el pensamiento de cientos de los mejores científicos durante décadas?

La elegancia de la sintaxis, la gramática, las teorías simbólicas del conocimiento, fueron incapaces de producir máquinas que pensaran, no ya que hablaran. En cambio, se echan paladas de datos a una pila de álgebra lineal, y tenemos algo que incluso a algunos puede parecer inteligencia artificial general. ¿Dónde quedó nuestra opinión, nuestra narrativa lógica y cuidadosamente organizada para entender y predecir un dominio?

¡Cuánta amargura!

El lamento por la teoría sintética, por los modelos analíticos, elegantes, es algo que yo puedo entender perfectamente. De formación matemático, en mi máster sobre tecnologías del lenguaje me especialicé en gramáticas formales, llegando a hacer mi TFM sobre ellas. ¡Ah, qué elegante, una gran gramática de rasgos, basada casi únicamente en el mecanismo de unificación! Pero que una teoría sea bonita no quiere decir que sea verdad.

Y, desde luego, como gente racional no podemos permitirnos pensar que una teoría con mayor capacidad predictiva, por inelegante y obtusa que nos parezca, sea menos verdad porque no se ajuste a nuestros criterios estéticos sobre el pensamiento. Nos gustaría un sistema de reglas, una narrativa lógica que redujera el caos y la aleatoriedad a un modelo mecanista del mundo, fácil de entender, predecir y explicar.

Pero como empiristas no deberíamos sorprendernos. El universo es grande y complicado, y lo entendemos a base de observación, a base de recopilar datos e información sobre eventos reales. Cuantos más de éstos tengamos, mejor será nuestro entendimiento. Las teorías y paradigmas científicos nos ayudan a explicar el mundo, a dar el siguiente paso, pero no son sino modelos provisionales a superar cuando tengamos mejor entendimiento o mayor experiencia: más cómputo, más datos.

La lección amarga no es ni lo uno ni lo otro, no es sino una traducción de la metodología empírica de la ciencia moderna a las máquinas pensantes y predictivas del siglo XXI. ¿Reduccionista es pensar que todo se resuelve con cómputo y datos? No, reduccionista es pensar que todo se puede explicar con cuatro ecuaciones, con narrativas ordenadas y pulidas que quepan en una cabeza. Usemos el conocimiento, teoricemos, propongamos modelos. Entendamos, expliquemos, narremos. Pero cuando nos superen los datos y el cómputo, no nos lamentemos, celebrémoslo.

¡Qué dulce sería si los humanos pudiéramos comprehender el universo! Pero no es así. ¡Y afortunadamente!

El universo es más interesante que eso.