Generación de consultas SQL

Los científicos de datos y analistas gastan 30 a 50% de su tiempo escribiendo SQL: exploración, agregaciones, uniones, ventanas analíticas. La IA generativa puede producir en pocos segundos consultas que habría tardado 30-60 minutos en escribir y depurar. La trampa: el SQL generado puede ser sintácticamente correcto pero semánticamente incorrecto (unión equivocada, doble conteo, NULL mal manejados). Esta guía presenta el flujo de trabajo riguroso que maximiza la productividad mientras evita los errores invisibles que falsan los resultados empresariales.

Flujo de trabajo paso a paso

Describir el esquema a la IA

Proporcionar las tablas involucradas con sus columnas principales, tipos y relaciones (PK/FK). Sin esquema, la IA inventa nombres de columnas plausibles pero inexistentes. Idealmente pega un DDL o un diccionario de tablas.

Formular la pregunta empresarial claramente

No 'dame un SELECT', sino 'para cada cliente activo hace más de 6 meses, calcula los ingresos acumulados en los últimos 12 meses y el porcentaje de crecimiento vs los 12 meses anteriores'. Cuanto más clara la pregunta, mejor la consulta.

Precisar la BD objetivo y sus especificidades

Postgres, BigQuery, Snowflake, Redshift, MySQL: las funciones analíticas y la sintaxis difieren. Precisar permite tener una consulta optimizada para tu dialecto.

Probar en una muestra antes de producción

Limitar a WHERE date >= '2025-01-01' AND id < 1000 para validar rápidamente. Comparar con un caso conocido (contado a mano) para verificar la coherencia de los resultados.

Iterar para optimizar

Si la consulta es lenta: hacer que la IA sugiera optimizaciones (índices faltantes, CTEs materializadas, orden de JOIN). Siempre verificar el plan de ejecución (EXPLAIN) antes de poner en producción.

Prompts copiables

Generación de consulta SQL empresarial

Eres experto SQL en [POSTGRES / BIGQUERY / SNOWFLAKE / REDSHIFT / MYSQL]. Aquí está mi esquema:nn[TABLAS + COLUMNAS + RELACIONES]nnPregunta empresarial: [PREGUNTA DETALLADA]nnEscribe una consulta que:n- Use los UNIONes correctos (siendo explícito en INNER vs LEFT)n- Maneje correctamente los NULLn- Evite doble conteon- Use CTEs nombrados para legibilidardn- Incluya comentarios sobre elecciones no trivalesnnProporciona: (1) la consulta, (2) una explicación en 3-5 líneas de las elecciones, (3) un resultado esperado en algunas filas para validación.

Depuración de una consulta lenta

Esta consulta se ejecuta en [DURACIÓN] en [VOLUMEN] de datos:nn[CONSULTA]nnEsquema:n[TABLAS + ÍNDICES EXISTENTES]nnPlan de ejecución:n[EXPLAIN ANALYZE OUTPUT]nnPropón:n1. **Diagnóstico**: ¿dónde están los cuellos de botella (full scan, mal orden de JOIN, índice faltante)?n2. **3 optimizaciones** por orden de impacto esperado, con la consulta modificada para cadan3. **Índices a crear** si es pertinente (con sintaxis CREATE INDEX)n4. **Riesgos**: impacto en escrituras, espacio en disco, locksnnObjetivo: pasar por debajo de [SLA DESEADO].

Conversión entre dialectos SQL

Convierte esta consulta de [DIALECTO_ORIGEN] a [DIALECTO_DESTINO]:nn[CONSULTA ORIGEN]nnMantén la misma lógica empresarial pero adapta:n- Funciones de fecha (DATE_TRUNC, EXTRACT, etc.)n- Funciones analíticas (window functions)n- Sintaxis de CTEsn- Gestión de tipos (TIMESTAMP, JSON, ARRAY)n- Particularidades del dialecto destino (LATERAL, QUALIFY, etc.)nnProporciona la consulta convertida + las 3 principales diferencias que tuviste que manejar.

Detección de errores semánticos

Audita esta consulta SQL para errores SEMÁNTICOS (no solo sintácticos):nn[CONSULTA]nnEsquema:n[TABLAS + COLUMNAS + CARDINALIDADES APROXIMADAS]nnPregunta empresarial esperada: [PREGUNTA]nnVerifica:n1. **Cardinalidad de UNIONes**: ¿riesgo de doble conteo?n2. **Gestión de NULLs**: COUNT(col) vs COUNT(*), AVG en NULL, etc.n3. **Filtros**: WHERE vs ON en LEFT JOIN, orden de condicionesn4. **Agregaciones**: GROUP BY coherente, HAVING vs WHEREn5. **Edge cases**: ¿qué pasa si una dimensión no tiene hechos? ¿si múltiples hechos por dimensión?nnPara cada problema: (a) línea involucrada, (b) explicación, (c) corrección.

Generación de consulta analítica con window functions

Para [PREGUNTA ANALÍTICA — ej: top 3 productos por categoría en ingresos, ranking de usuarios por mes, etc.]nnEsquema:n[TABLAS]nnEscribe una consulta usando __window functions__ (ROW_NUMBER, RANK, DENSE_RANK, LAG, LEAD, SUM OVER...) óptima para [DIALECTO].nnExplica en 3 puntos: (1) por qué window en lugar de subconsulta correlacionada, (2) el PARTITION BY y ORDER BY elegidos, (3) el rendimiento esperado. Incluye un ejemplo de resultado.

Herramientas recomendadas

Claude Opus 4.5

★ 4.9 (92) · 20 USD/mois

Claude Opus 4.5 : modèle premium d’Anthropic pour code, agents et tâches complexes en entreprise.

Por qué : Excellence sur le SQL complexe et les fonctions analytiques. Comprend les subtilités sémantiques mieux que les concurrents.

Probar ↗Reseña completa

ChatGPT

★ 4.9 (528) · 20 USD/mois

Assistant conversationnel polyvalent d’OpenAI. Rédige, résume, code, traduit et répond à tout type de question.

Por qué : Solide sur tous les dialectes courants, particulièrement bon pour la conversion entre BDD.

Probar ↗Reseña completa

🤖

Cursor

★ 4.8 (145) · 20 USD/mois

Éditeur de code IA révolutionnaire basé sur VS Code avec agents autonomes

Por qué : Si vous travaillez sur des fichiers SQL versionnés (dbt, scripts de migration), Cursor donne du contexte projet à l'IA.

Probar ↗Reseña completa

ROI estimado

Tiempo ahorrado

60-70% en la redacción de consultas complejas

Mejora de calidad

Detección de errores semánticos en pre-producción

Costo

Incluido en suscripción Claude Pro / ChatGPT Plus (20-30€/mes)

Preguntas frecuentes

¿Maneja bien la IA todos los dialectos SQL?

Postgres, MySQL, BigQuery, Snowflake, Redshift: muy bien. SQL Server (T-SQL): bien, con a veces olvidos en sintaxis propietarias. Oracle (PL/SQL): correcto pero requiere más verificación. DuckDB, SQLite: bien en SQL estándar, a veces confuso en extensiones.

¿Se puede hacer SQL en datos sensibles con ChatGPT?

El código SQL en sí no es sensible — son los datos los que lo son. Así que sí, puedes generar consultas SQL a través de cualquier LLM mientras no envíes datos reales de cliente. Solo pega esquemas y ejemplos ficticios en los prompts.

¿Puede la IA reemplazar a un DBA?

Para escritura de consultas comunes, ayuda en optimización, documentación: ampliamente. Para arquitectura de BD, tuning fino del SGBD, alta disponibilidad, copia de seguridad, seguridad: no, el DBA sigue siendo indispensable. La IA es un excelente escritor SQL, no un DBA.

¿Hay que documentar que una consulta fue generada por IA?

Buena práctica en entorno colaborativo (dbt, Airflow, scripts versionados): sí, en comentario con la consulta + el prompt usado. Esto permite a los revisores entender la lógica y regenerar si es necesario con mejoras.

← Volver a la guía Data scientist

🗄️ Generación de consultas SQL