MENÚ
manuscritos-resucitados-ia-restauracion-textos-antiguos-1774454164263.html
Manuscritos Resucitados: Cómo la IA está devolviendo la vida a textos antiguos dañados
#Inteligencia Artificial #Restauración de Manuscritos #IA Generativa #Patrimonio Cultural

Manuscritos Resucitados: Cómo la IA está devolviendo la vida a textos antiguos dañados

25 de marzo de 2026

Un hallazgo entre cenizas

En el verano de 2022, el fraile archivero del Monasterio de San Juan de la Peña, mientras revisaba una caja de documentos rescatados de un incendio del siglo XVIII, encontró una hoja casi ilegible: los bordes quemados, la tinta corrida por el agua y solo unas pocas palabras visibles en latín. Lo que parecía un fragmento perdido para siempre despertó su curiosidad y, tras contactar a un equipo de investigadores de la Universidad de Zaragoza, nació la idea de usar inteligencia artificial para "resucitar" ese texto.

La tecnología detrás: modelos de difusión generativa

Los modelos de difusión, conocidos por su capacidad de generar imágenes realistas a partir de ruido, han demostrado ser igualmente poderosos para completar datos faltantes en secuencias discretas, como texto o manuscritos escaneados. El proceso se basa en:

  1. Codificación del daño: Se crea una máscara que indica qué píxeles (o glifos) están dañados o ausentes.
  2. Aprendizaje contextual: El modelo, entrenado con miles de páginas de códices similares, aprende la distribución estadística de letras, abreviaturas y estilos de escritura propios de la época y el script utilizado.
  3. Reconstrucción iterativa: Partiendo de ruido, el modelo va eliminando esa incertidumbre paso a paso, guiado por la máscara y el contexto visible, hasta producir una hipótesis de cómo debería verse el segmento perdido.
  4. Validación cruzada: Se generan varias versiones y se elige la que maximiza la coherencia lingüística y palaeográfica, revisada posteriormente por expertos.

Este enfoque, adaptado del modelo Stable Diffusion pero con una capa de lenguaje especializada en scripts medievales, permite reconstruir no solo la forma de los glifos, sino también su sentido semántico.

Caso de estudio: el Códice de San Millán

El manuscrito en cuestión pertenece al Códice de San Millán, una colección del siglo XII que contiene tratados de medicina herbal y anotaciones litúrgicas. Gracias al modelo de difusión, se lograron recuperar:

  • Tres líneas completas de una receta para un ungüento antiinflamatorio, incluyendo la proporción exacta de resina de pino, miel y polvo de raíz de valeriana.
  • Un fragmento marginal donde un copista anotó una disputa sobre la fecha de Pascua en el año 1143, revelando un detalle desconocido sobre el uso del calendario juliano en monasterios aragoneses.
  • Una ilustración parcial de una planta medicinal, cuya forma completada coincide con una especie actualmente identificada como Digitalis purpurea (dedalera), usada históricamente para tratamientos cardíacos.

Estos hallazgos no solo completan lagunas textuales, sino que aportan datos botánicos y cronológicos de gran valor para historiadores de la ciencia y lingüistas.

Resultados y descubrimientos

Tras la reconstrucción, el equipo realizó una serie de verificaciones:

  • Análisis lingüístico: La gramática y el vocabulario coinciden con los usos documentados en otros códices del mismo scriptorio, descartando la hipótesis de un falso moderno.
  • Datación por carbono: Las páginas físicas datan de 1135‑1150 d.C., coherente con el contenido recuperado.
  • Validación botánica: Expertos en etnobotánica confirmaron que la receta del ungüento coincide con preparaciones usadas en la medicina popular pirenaica hasta el siglo XIX.

Además, la IA generó una heatmap de incertidumbre que muestra qué zonas tuvieron mayor ambigüedad; estas áreas fueron señaladas para revisión manual, garantizando transparencia en el proceso.

Implications for the future

El éxito de este proyecto abre varias vías:

  • Escaneo masivo de archivos dañados: Bibliotecas y archivos nacionales podrían aplicar pipelines similares a colecciones afectadas por agua, fuego o moho, recuperando millones de páginas actualmente consideradas perdidas.
  • Asistente de transcripción para paleógrafos: Integrando el modelo en herramientas de edición, los especialistas podrían obtener sugerencias en tiempo real mientras trabajan sobre fotografías de alta resolución.
  • Preservación de lenguas indígenas: La misma técnica puede adaptarse a manuscritos en lenguas menos documentadas, ayudando a revitalizar vocabulario y estructuras gramaticales que ya no se usan.

Conclusión

Desde una hoja casi irreconocible hasta una receta medicinal y una nota astronómica medieval, la IA demostró ser más que un generador de imágenes: se convirtió en un arqueólogo digital capaz de leer entre las líneas del tiempo. Los manuscritos resucitados no solo enriquecen nuestro conocimiento del pasado, sino que recuerdan que, incluso cuando el fuego y el agua intentan borrar la historia, la tecnología puede devolverle su voz.


¿Te imagina qué otros secretos yacen escondidos en los archivos del mundo, esperando a que un algoritmo les devuelva la luz?

END_OF_GENERATION
_