Historiar, el pasado y la IA (I)

Cuaderno común, columna de Joed Amílcar Peña Alcocer: Historiar, el pasado y la IA (I)

|
Compartir noticia en twitter
Compartir noticia en facebook
Compartir noticia por whatsapp
Compartir noticia por Telegram
Compartir noticia en twitter
Compartir noticia en facebook
Compartir noticia por whatsapp
Compartir noticia por Telegram

Pocas transformaciones tecnológicas han generado tanto entusiasmo y confusión en el ámbito académico como la irrupción de la Inteligencia Artificial (IA) Generativa. En los pasillos de las facultades y centros de investigación la pregunta ya no es si la IA llegó para quedarse, sino qué hacer con ella.

Cuando interactuamos con herramientas como GhatGPT, Gemini o Claude (llamados técnicamente Modelos de Lenguaje Grande), es fácil caer en la ilusión de que estamos dialogando con una entidad que “sabe” historia. Sin embargo, estos sistemas fueron entrenados con grandes volúmenes de texto provenientes de libros, artículos, páginas web y foros, con el objetivo de aprender patrones estadísticos del uso de palabras; es decir, qué palabras tienden a seguir a otras palabras, qué estructuras argumentativas son comunes en determinados géneros discursivos, qué tipo de respuestas se esperan ante ciertos tipos de preguntas. Durante este proceso, los modelos no almacenan los contenidos como una biblioteca o una base de datos, solo identifican relaciones estadísticas entre palabras, frases y conceptos.

La IA generativa no recupera información almacenada, sino que genera texto estadísticamente plausible. No existe, dentro de un modelo de lenguaje grande, algo comparable a un índice o catálogo de datos e información. El modelo no “sabe” que la Revolución Mexicana comenzó en 1910 de la manera en que un libro lo registra, produce esa respuesta porque la secuencia de palabras relacionada a “Revolución Mexicana – 1910” aparece de manera estadísticamente predominante en su corpus de entrenamiento y lo mismo ocurre con cualquier otro tema como la Guerra de Castas, el Porfiriato o la biografía de un personaje histórico. Por eso es importante salir de uno de los malentendidos más extendidos, consistente en utilizar a ChatGPT, Gemini o Claude como si fueran motores de búsqueda o bases de datos especializadas.

Las bases de datos almacenan registros verificables, por eso cuando una investigadora consulta Redalyc, Scielo, JSTOR o cualquier catálogo, obtiene registros que existen de manera independiente, sean documentos físicos o digitales, artículos publicados con autoría y fecha, fuentes que pueden ser localizadas, revisadas y citadas, es decir, la información no se genera, se recupera. Un motor de búsqueda, por su parte, indexa páginas web existentes y devuelve referencias a fuentes externas, no fabrica contenido. Aunque hay sistemas de IA para localizar información como Connected Papers o Research Rabbit, estos funcionan con lógicas diferentes a los chats de inteligencia artificial.

Cuando un usuario escribe una pregunta y el modelo genera una respuesta, lo que ocurre no es una consulta a una base de datos ni una búsqueda en un repositorio de información, sino un proceso de generación probabilística. El modelo predice, palabra a palabra, cuál es la continuación más probable de la secuencia, dado el contexto de la conversación y los patrones aprendidos durante el entrenamiento, las fuentes que incluye son aquellas que puede relacionar con el contenido generado.

Para poder dialogar sobre la IA en la labor de los historiadores esto es lo primero, saber qué es. Conocer sus limitaciones nos permite derivar algunas orientaciones prácticas sobre su uso, asunto de la siguiente entrega de esta columna. (Continuará). 

Lo más leído

skeleton





skeleton