El auge de la IA y especialmente de los modelos de lenguaje pueden hacer pensar que las bases de datos convencionales, que analizan y "desarman" la información al conservarla, pierden vigencia o complican la operación de la IA y los chatbots. En realidad, el panorama es muy diferente. Sin datos en mis archivos, consulté al respecto a Gemini 3. La respuesta incluyó una comparación de las bases de datos relacionales con las bases de datos de vectores, lo cual no viene al caso. Seleccioné las partes de la respuesta que sí cumplen con lo esperado:
El panorama de la gestión de datos en 2026 muestra que las bases de datos convencionales (especialmente las relacionales o SQL) no solo siguen vigentes, sino que están experimentando un "renacimiento" impulsado por la IA. A continuación, presento un resumen de la literatura académica y técnica reciente que analiza esta convivencia:
1. El Resurgimiento del Modelo Relacional (SQL)
Artículos como "SQL and the Relational Model: Enduring Standards in the Age of AI" (2025) sostienen que el modelo relacional es extremadamente resiliente. (...) Vigencia operativa: Encuestas de desarrolladores (como Stack Overflow 2024-2025) confirman que SQL sigue siendo uno de los lenguajes más deseados. Extensiones de vectores: El uso de extensiones como pgvector en PostgreSQL permite que las organizaciones mantengan su infraestructura probada mientras añaden capacidades de búsqueda semántica para modelos de lenguaje (LLMs).
2. Impacto de los LLMs en la Gestión de Datos
La investigación presentada en ResearchGate y VLDB (Very Large Data Bases) en 2024-2025 identifica áreas clave donde la IA potencia a las bases de datos convencionales:Interfaces de lenguaje natural: Los LLMs permiten que usuarios no técnicos consulten bases de datos SQL usando lenguaje humano, eliminando la barrera del código complejo.Optimización autónoma: Se están publicando estudios sobre "Bases de Datos Autónomas" que usan IA para el auto-tunning (ajuste de rendimiento), indexación predictiva y detección de anomalías sin intervención humana.Limpieza de datos: Modelos fundacionales están logrando resultados de vanguardia (SoTA) en tareas de integración y limpieza de datos, superando a los algoritmos tradicionales.
3. Comparativa: Bases de Datos de Vectores vs. Relacionales [Irrelevante aquí]
4. Desafíos y Ética (Visión Jurídica y Académica)
Artículos publicados en 2024 y 2025 (como los de Scimago y repositorios académicos en Argentina y Chile) subrayan que la vigencia de las bases de datos tradicionales también es una cuestión de gobernanza:
Transparencia: Las bases de datos convencionales ofrecen una trazabilidad que las "cajas negras" de la IA aún no alcanzan.
Privacidad: Nuevas leyes (como la Ley 21.719 en Chile o actualizaciones en la UE) exigen que el tratamiento de datos para IA sea lícito y limitado, algo que las estructuras SQL facilitan mediante controles de acceso robustos.
Resumen de referencias clave encontradas:
Fernández & Elmore (2024): "How Large Language Models Will Disrupt Data Management". Analiza cómo la programación declarativa (SQL) es el camino a seguir para sistemas de IA.
Li et al. (VLDB 2024): "LLM for Data Management". Explora el uso de agentes de IA para optimizar motores de búsqueda de bases de datos tradicionales.
Dataversity (2025): "SQL and the Relational Model: Enduring Standards". Defiende la permanencia de SQL frente a las bases de datos NoSQL y de vectores.
Surge una pregunta para los medios de comunicación: ¿vale la pena seguir desarrollando bases de datos analíticas (cfr mi artículo "El archivo inteligente") cuando un programa de IA local puede responder cualquier consulta a partir del archivo de respaldo de todo lo recopilado y publicado por el medio? (Distintos modelos locales de chatbots ya están disponibles, como por ejemplo Cowork, de Anthropic, un agente de IA que puede gestionar archivos en la computadora de un usuario. Lo local es fundamental para mantener la seguridad y la propiedad de la información.)
No propondré una respuesta: creo que cada empresa debería hacerse la pregunta.
Mis referencias:
- El archivo inteligente, Cuadernos de Información PUC n°9, 1994.
Puede consultarse también, a modo de referencia histórica, mi texto "Prensa y "Big Data": El desafío de la acumulación y análisis de datos", Revista Mediterránea de Comunicación, Vol.4 N.2, 2013.
No hay comentarios:
Publicar un comentario
Nota: solo los miembros de este blog pueden publicar comentarios.