martes, 19 de marzo de 2024

IA: ¿Adiós documentalistas?

 Desde hace algún tiempo se viene advirtiendo que muchas tareas realizadas por seres humanos serán traspasadas a la inteligencia artificial. "La automatización va a ocurrir cada vez más en trabajos de carácter intelectual, no como hasta ahora, que solo afectaba a quienes trabajaban en cadenas de producción", dice Jordi Torres, experto en IA y supercomputación de la Universidad Politécnica de Cataluña (Rada, Agencia Sinc). Entre los profesionales afectados se encuentran, seguramente, los documentalistas.

Sería una consecuencia de las aplicaciones de la IA generativa, En efecto, ésta permite obtener información sin necesidad de recurrir a bases de datos estructuradas como las que desarrollan los especialistas de la clasificación. La IA generativa recurre al aprendizaje automático (deep learning) a partir de la acumulación de información "en bruto", es decir en su formato original, y a mecanismos de análisis para encontrar patrones y luego extraer la información que se adecue al patrón detectado en la consulta. En muchas exposiciones sobre la IA generativa se dice que "crea" contenido nuevo. Pero es llevar quizás lejos el concepto de creación: el resultado podrá ser un texto (o una imagen) formalmente nuevo, pero el contenido será obviamente una acumulación de datos existentes aunque en una nueva presentación y eventualmente estableciendo relaciones novedosas, que son su principal aporte (y riesgos de error).

También se dice, algunas veces, que opera así "de un modo semejante al cerebro". Esto es equivocado. Cuando ingresa información al cerebro humano y es conservada, ingresa en dos tipos de memorias: la episódica, que recoge la información en su desarrollo temporal (histórico), y la semántica, que se constituye a partir del análisis conceptual (categorización) de la información. El sistema nervioso tiene un subsistema que es una suerte de documentalista, que clasifica la información cuando ingresa y la memoria semántica resultante es el principal ingrediente dispuesto para facilitar la recuperación de información (y la base de la inteligencia), evitando de este modo la necesidad de revisar el contenido completo de la memoria episódica.

Los métodos de IA generativa prescinden de esta división. No hay procesamiento en el momento de la entrada de información (salvo la transformación digital en las neuronas artificiales): el proceso semántico se realiza sobre la totalidad del material acumulado, buscando "patrones" a través de un proceso estadístico. Es mucho menos eficiente que el cerebro humano ya que cada consulta implica revisar la totalidad del material acumulado, mientras el cerebro - que procesó la entrada - dispone de una suerte de base de datos de referencias que permite apuntar inmediatamente a lo requerido.

Un centro de documentación podría, de este modo, hoy, limitarse a acumular la información (ya existen aplicaciones de bases de datos que la admiten en cualquier formato) y aplicar luego algoritmos de IA generativa.

Indirectamente, según una noticia que leímos hace unos días, ingresan en esta vía el grupo de periódicos Prisa Media y Le Monde al firmar un acuerdo de colaboración con OpenAI, para dar acceso a las noticias por ChatGPT: "En colaboración con Le Monde y Prisa Media, nuestro objetivo es permitir que los usuarios de ChatGPT de todo el mundo conecten con las noticias de una forma más interactiva y que tengan una visión más completa de la actualidad", dicen en OpenAI (Genbeta, 14/03/24).

Según el director ejecutivo de Prisa Media, Carlos Nuñez, se trata de "Aprovechar las capacidades de ChatGPT nos permite presentar nuestro periodismo en profundidad y de calidad de maneras novedosas. Este es un paso definitivo hacia el futuro de las noticias, donde la tecnología y la experiencia humana se fusionan para enriquecer la experiencia del lector." (El País, 13/03/24)

No hablan, por cierto, de sus sistema de documentación. Pero disponen, sin dudas, de toda su producción en un archivo general y bastaría con instalar un "motor" de IA generativa (los hay de "código abierto") para reemplazar el oficio de documentalista.

Pero quizás no deba suprimirse este digno oficio, sino transformarlo. El problema de hoy es poder formular las preguntas adecuadas para obtener el resultado deseado. Se habla de una nueva profesión: el ‘prompt engineer’ o ingeniero de instrucciones. ¿No sería, justamente, la función propia de un documentalista? No requiere ser ingeniero en informática pero sí tener conocimientos de "LLM", los "modelos de lenguaje a gran escala" utilizados para crear las aplicaciones de IA generativa para, así, poder hacer preguntas más eficientes. ¡He aquí un tema del que han de preocuparse las escuelas o departamentos de documentación de las universidades!

Además, muchas empresas están abandonando la nube para conservar sus archivos en sus propios servidores. Podrían, de este modo, también sacarles ventaja con un motor de IA propio. Pero, para ello, necesitan computadores más poderosos. Felizmente, ya hay procesadores centrales de más de miles de núcleos y Nvidia acaba de anunciar para el próximo año Blackwell RTX50, la arquitectura de GPU de próxima generación, diseñada para empresas, que vendrá con 208 mil millones de transistores y permite conectar 576 GPU en una sola flota. Las GPU son, originalmente, unidades de procesamiento gráfico pero son las preferidas para los procesos de IA. Se unen a CPU (unidades centrales de proceso) que son las que controlan la actividad del computador (entradas y salidas de datos y entrada de comandos). Nvidia ofrece actualmente un servidor "más reducido", con 72 GPU B200 y 36 CPU Grace. La velocidad de interconexión es de 10 TB por segundo (Digital Trends, 19/3/24). Las B200 son anteriores a la anunciada RTX50 pero ya son capaces de manejar billones de parámetros y alcanzar los 20 petaFLOPS de rendimiento (Infobaes, 19/03/24). Llevan la informática y especialmente la IA a un nuevo auge aún difícil de vislumbrar.


Referencias

Genbeta, 14/03/2024: Interactuar con noticias en ChatGPT será posible: El País y Le Monde serán los primeros, y podrá entrenarse con sus datos

El País, 13/03/2024: OpenAI anuncia un acuerdo con Prisa Media y ‘Le Monde’

La Vanguardia, 26/04/2023: Cómo hacer las preguntas correctas a la IA: el arte  del ingeniero de prompts

Rada, A.G. (2024): Tenemos que pensar en cómo controlar la IA porque es muy potente y lo va a cambiar todo, Agencia Sinc, 18/3/2024.