Historiar, el pasado y la IA (II)
Cuaderno común, columna de Joed Amílcar Peña Alcocer: Historiar, el pasado y la IA (II)
En el debate contemporáneo sobre el futuro de la investigación histórica, la inteligencia artificial ha irrumpido como un cambio de paradigma y objeto de dudas. Mientras la atención se concentra en modelos generativos como ChatGPT, Gemini o Claude, que parecen “escribir” o interpretar la historia por sí solos, a menudo pasamos por alto los mecanismos tras esa ilusión. Estos sistemas producen textos extraordinariamente convincentes gracias a su vasto entrenamiento con literatura académica de alta calidad; sin embargo, al operar bajo criterios de coherencia lingüística y no de verificabilidad, son capaces de inventar citas bibliográficas o mezclar eventos históricos.
A este fenómeno se le denomina alucinación, un término ya consolidado en la literatura especializada. Las alucinaciones son respuestas lingüísticamente coherentes y formalmente plausibles, pero factualmente incorrectas o directamente inventadas. Otro problema que debemos sumar es el sesgo algorítmico, esto implica que los modelos reproducen los sesgos del corpus con el que fueron entrenados, los más comunes son la sobrerrepresentación del mundo anglosajón y la prevalencia de perspectivas hegemónicas sobre narrativas marginadas. Por estos motivos, para dimensionar el verdadero potencial de la IA, debemos mirar más allá de la generación de texto y observar cómo se ha aplicado.
La última década ha sido prolífica en el uso de herramientas de aprendizaje automático para proyectos históricos. Desde hace años se ha aprovechado el Reconocimiento Óptico de Caracteres (OCR) para convertir millones de páginas escaneadas en textos analizables computacionalmente. Un paso más allá es el procesamiento de fuentes primarias a través del Reconocimiento de Texto Manuscrito (HTR), tecnología que utiliza redes neuronales para reconocer caracteres en manuscritos, diarios personales o correspondencia, logrando transcripciones asistidas con una increíble precisión.
Proyectos como Transkribus, desarrollado en Europa y utilizado para manuscritos en español, latín, náhuatl y otras lenguas, han permitido procesar volúmenes documentales que habrían requerido décadas de trabajo paleográfico manual. A pesar de ello, la herramienta no elimina al paleógrafo, los errores persisten y requieren revisión experta. Aunque la IA lleva décadas al servicio de la disciplina, su adopción ha sido desigual, en contextos como Yucatán, por ejemplo, existe un rezago evidente, herramientas accesibles y con años de entrenamiento como Transkribuso la aplicación de OCR en procesos de digitalización no forman parte de los programas de formación profesional en la disciplina histórica y, probablemente, no estén integradas en el quehacer de la academia local.
Más allá de la transcripción, del uso de la IA para el procesamiento de lenguaje natural permite analizar vastos corpus documentales para detectar tendencias, conceptos recurrentes y transformaciones semánticas en la prensa o documentos de siglos pasados. Este tipo de aplicación ha facilitado la creación de bases de datos relacionales para el análisis de redes sociales, élites coloniales, rutas mercantiles o movimientos intelectuales, el proyecto Mappingthe Republicof Letters es uno de los ejemplos más conocidos de esta aproximación metodológica.
La IA no ha llegado para reemplazar el rigor analítico vinculado a la historia profesional, sino para expandir las fronteras de lo metodológicamente posible. Sin embargo, la tensión entre el sesgo algorítmico y la responsabilidad al investigar es lo que nos obliga a preguntarnos ¿cuáles deben ser los límites en la investigación asistida por inteligencia artificial? Ese será tema de la siguiente columna. (Continuará)
