Generación de pruebas unitarias

A los desarrolladores no les gusta escribir pruebas. Sin embargo, es una de las actividades donde la IA brilla más: generación rápida de un conjunto completo que cubra casos nominales, valores extremos, errores y mocks. Bien utilizada, puede aumentar la cobertura de un proyecto del 30 al 80% en algunas horas de trabajo en lugar de semanas. La trampa clásica: dejar que la IA genere pruebas "happy path" que siempre pasen pero no prueben nada crítico. Esta guía presenta el flujo de trabajo para obtener pruebas robustas, enfocadas en los errores reales.

Flujo de trabajo paso a paso

Elegir el framework y las convenciones

Indique a la IA el framework de prueba (Jest, Vitest, Pytest, JUnit, Go test, RSpec…), las convenciones del proyecto (naming, mocks, fixtures) y la estructura esperada (Arrange-Act-Assert, Given-When-Then).

Enviar la función a probar

Dale a la IA la función y su contexto mínimo (tipos de parámetros, dependencias utilizadas). Evita pegar todo el archivo — es más preciso y consume menos tokens.

Solicitar casos nominales Y casos límite

Fuerce a la IA a cubrir explícitamente: entrada válida, valores extremos (nulo, vacío, máximo, mínimo), errores esperados, comportamientos asincronos, efectos secundarios. Sin esta indicación, la IA tiende a cubrir solo el camino feliz.

Verificar la cobertura real

Ejecuta las pruebas generadas y mira el informe de cobertura. Identifica las ramas no cubiertas y haz que la IA las complemente. Itera 2-3 veces para alcanzar 80%+.

Revisar y endurecerse

La IA a veces genera pruebas que siempre pasan (aserciones muy permisivas, mocks mal configurados). Revisa cada prueba y verifica que realmente falle cuando rompas la función. Es la única garantía de que sirve para algo.

Prompts copiables

Generación de pruebas completas

Eres experto en pruebas unitarias en [LENGUAJE/FRAMEWORK]. Genera una suite de pruebas para esta función:nn[CÓDIGO FUNCIÓN]nnRestricciones:n- Framework: [JEST/VITEST/PYTEST/JUNIT/...]n- Estilo: Arrange-Act-Assert, una prueba = un comportamienton- Cubre obligatoriamente: (a) casos nominales, (b) valores extremos (nulo, indefinido, vacío, negativo, muy grande), (c) errores y excepciones, (d) efectos secundarios y llamadas burladasn- Naming explícito: `should [comportamiento esperado] when [condición]`n- Mocks: utiliza [VITEST MOCK / JEST MOCK / PYTEST FIXTURES]nnProporciona el código completo del archivo de prueba, listo para ejecutar.

Cobertura de casos límite faltantes

Aquí hay una función y sus pruebas existentes:nnFUNCIÓN:n[CÓDIGO]nnPRUEBAS EXISTENTES:n[CÓDIGO PRUEBAS]nnIdentifica los casos límite NO cubiertos por las pruebas existentes: valores extremos, errores, comportamientos asincronos, race conditions, estados compartidos. Genera solo las pruebas adicionales necesarias (sin duplicados con las existentes). Para cada prueba añadida, explica en una línea por qué es importante.

Prueba de API REST

Genera pruebas de integración para este endpoint en [FRAMEWORK]:nn[CÓDIGO RUTA/CONTROLADOR]nnUtiliza [SUPERTEST / PYTEST + REQUESTS / RESTASSURED]. Cubre:n- Respuesta 200 con payload válidon- Validación de campos requeridos (400)n- Autenticación faltante o inválida (401)n- Permisos insuficientes (403)n- Recurso no encontrado (404)n- Errores de servidor esperados (500)n- Casos límite comerciales específicos de este endpointnnBurla de dependencias externas (DB, servicios terceros).

Prueba de hook React

Genera pruebas para este hook React:nn[CÓDIGO HOOK]nnUtiliza __@testing-library/react-hooks__ o __renderHook__ de @testing-library/react según la versión. Cubre: valor inicial, mutaciones de estado, efectos secundarios (useEffect), limpieza, cambios de props, error boundaries si es relevante. Proporciona el archivo de prueba completo.

Generación de fixtures de prueba

Para esta estructura de datos:nn[TIPO / SCHEMA / INTERFACE]nnGenera fixtures de prueba que cubran:n- 3 casos válidos típicos (diferentes para evitar falso positivo en igualdades)n- 2 casos con valores extremos (campos vacíos, longitud máxima, valores extremos)n- 2 casos inválidos (campos faltantes, tipos incorrectos)nnFormato de salida: factory functions u objetos simples exportados. Nombra explícitamente cada fixture.

Herramientas recomendadas

Claude Code

★ 4.9 (92) · 20 USD/mois

Assistant de développement IA agentique par Anthropic : comprend votre codebase, édite des fichiers, exécute des commandes et s'intègre à votre environnement de développement.

Por qué : Génère des suites de tests complètes en comprenant le contexte du projet via CLAUDE.md et la structure du repo.

Probar ↗Reseña completa

🤖

Cursor

★ 4.8 (145) · 20 USD/mois

Éditeur de code IA révolutionnaire basé sur VS Code avec agents autonomes

Por qué : Le mode Composer permet de générer un fichier de tests entier en référençant la fonction cible avec @file.

Probar ↗Reseña completa

GitHub Copilot (Copilot X)

★ 4.8 (97) · 10 USD/mois

Assistant IA de développement intégré à l’IDE pour compléter du code, expliquer, générer des fonctions et accélérer le debug.

Por qué : L'autocomplétion in-IDE est excellente pour compléter des tests cas par cas, intégrée à votre workflow existant.

Probar ↗Reseña completa

ROI estimado

Tiempo ahorrado

70-80% en la escritura inicial de pruebas

Mejora de calidad

Cobertura 80%+ alcanzable en horas vs. semanas

Costo

Incluido en suscripción IDE IA (10-20€/mes)

Preguntas frecuentes

¿Son confiables las pruebas generadas por IA?

Son confiables en la forma (sintaxis, estructura, mocks) pero pueden ser engañosas en el fondo: aserciones demasiado permisivas, casos límite faltantes, pruebas que pasan incluso cuando el código está roto. La regla absoluta: mutea tu código (cambia un `+` por un `-`) y verifica que las pruebas fallen. Si no, no sirven para nada.

¿Debo escribir pruebas ANTES del código (TDD) con IA?

Sí es incluso un excelente uso: describe la especificación a la IA y haz que genere las pruebas. Luego pide la implementación que las hace pasar. Esto invierte la trampa clásica de las pruebas redactadas después para confirmar el código existente.

¿Puede la IA generar pruebas E2E (Cypress, Playwright)?

Sí, pero con menos eficiencia que para pruebas unitarias. Las pruebas E2E requieren conocimiento del DOM, selectores y tiempos de espera que la IA no puede adivinar sin acceso a la aplicación. Lo mejor: descríbele el escenario del usuario y proporciona el HTML/estructura de la página.

¿Cuánto cuesta una suite de pruebas generada por IA?

Con una suscripción a Cursor o Claude Code (~20€/mes), puedes generar cientos de archivos de prueba por mes sin exceder. Para volúmenes masivos (cobertura de legacy de 100k líneas), un enfoque por lotes vía API puede costar 50-200€ en tokens, pero sigue siendo 10 veces más barato que el equivalente humano.

← Volver a la guía Développeur

🧪 Generación de pruebas unitarias