Descifrando lo indecible: cómo la IA intenta leer el Voynich

Un misterio que ha resistido cinco siglos

Imagina a un monje del siglo XV, temblando mientras copia unas páginas llenas de garabatos extraños y plantas que nadie ha visto jamás. Ese manuscrito, conocido hoy como el Voynich, ha desafiado a criptógrafos, lingüistas e incluso a equipos de inteligencia durante más de 500 años. Cada teoría ha fracasado: ¿es un lenguaje perdido, un elaborado engaño o un código alquímico?

Por qué los métodos tradicionales fallan

Los enfoques clásicos se basan en análisis estadísticos de frecuencias de símbolos o en la búsqueda de patrones lingüísticos conocidos. El problema es que el Voynich no muestra las propiedades estadísticas de ningún idioma natural registrado: su entropía es extrañamente alta, sus "palabras" se repiten de formas que no coinciden con ninguna gramática conocida y sus ilustraciones de plantas no coinciden con ninguna especie catalogada.

La nueva estrategia: modelos multimodales de lenguaje e imagen

En lugar de tratar el texto como un código puro, un grupo de investigadores de la Universidad de Tokio y el MIT propuso un enfoque multimodal: combinar modelos de lenguaje grandes (como una variante de GPT-4 entrenada en corpus de lenguas medievales) con redes neuronales convolucionales que analizan las dibujos botánicos y astronómicos del manuscrito. La idea es que, si el texto y las imágenes fueron creados conjuntamente por un mismo autor, deberían existir correlaciones latentes que un modelo capaz de razonar sobre ambas modalidades pueda descubrir.

Un caso de estudio: el proyecto "VoynichNet"

En 2024 el laboratorio VoynichNet publicó sus primeros resultados. Entrenaron un modelo llamado VoiFormer con tres fuentes de datos:

Un corpus de textos en latín, griego antiguo y lenguas vernáculas europeas del siglo XIV-XV.
Un conjunto de ilustraciones de herbarios y bestiarios de la misma época.
Las páginas digitalizadas del Voynich, separando texto y dibujos en canales distintos.

El modelo aprendió a predecir, dada una ilustración, qué tipo de palabras o fragmentos de texto eran más probables de acompañarla, y viceversa. Después de varias épocas, el VoiFormer comenzó a generar asignaciones de significado que mostraban cierta coherencia: por ejemplo, asociaba dibujos de raíces tuberosas con secuencias de glifos que aparecían frecuentemente en secciones que los estudiosos llaman "farmacopea".

Qué descubrimos (y qué no)

El sistema no logró traducir el manuscrito al estilo de un diccionario, pero reveló patrones interesantes:

Bloques temáticos: ciertas secciones del texto se alinean con tipos de plantas (plantas medicinales, plantas tóxicas, plantas ornamentales).
Secuencias repetitivas: se identificaron "frases" que aparecen siempre junto a ciertos tipos de dibujos astronómicos, sugiriendo una posible función calendárica o ritual.
Entropía reducida en contexto: cuando el modelo condiciona su predicción tanto en el texto anterior como en la imagen asociada, la entropía de los glifos disminuye un 18% respecto al modelo que solo ve texto.

Aún así, el Voynich sigue siendo resistente: no hay una traducción literal, y los críticos advierten que el modelo podría estar simplemente capturando coincidencias estadísticas impuestas por el entrenamiento.

¿Qué significa esto para la lingüística y la historia?

Si la hipótesis multimodal se confirma, estaríamos ante una de las primeras pruebas de que un manuscrito medieval pudo haber sido diseñado como un sistema de codificación integrado, donde texto e imagen se refuerzan mutuamente para transmitir conocimientos esotéricos (tal vez alquimia, medicina o astronomía). Esto abriría la puerta a reexaminar otros códices enigmáticos (como el Libro de Soyga o el Ripley Scroll) bajo la misma lente.

Próximos pasos y desafíos éticos

Los investigadores planean:

Ampliar el corpus de entrenamiento con más herbarios y textos alquímicos digitalizados.
Incorporar modelos de difusión que puedan generar ilustraciones plausibles a partir de texto previsto, cerrando el ciclo de retroalimentación.
Abrir el código y los datos bajo licencias abiertas para evitar que el trabajo quede atrapado en intereses propietarios.

Éticamente, se debe cuidar que cualquier interpretación no se presente como verdad definitiva sin evidencia independiente, evitando alimentar teorías de conspiración o pseudohistoria.

Conclusión

El Voynich sigue siendo un espejo de nuestros límites intelectuales, pero la IA multimodal está empezando a dibujar contornos donde antes solo había niebla. Tal vez nunca leamos sus palabras como un novela, pero cada algoritmo que logra conectar su texto con sus dibujos nos acerca un paso más a entender la mente de quien, hace cinco siglos, decidió escribir un lenguaje que solo el futuro podría intentar descifrar.