Gemma 4 es la última generación de modelos __de código abierto__ de Google DeepMind, derivada de la investigación Gemini 3. La familia incluye variantes pre-entrenadas e instruction-tuned, con una ventana de contexto de hasta __256K tokens__ y soporte nativo para más de 140 idiomas. Los modelos integran un modo __thinking configurable__, capacidades multimodales de imagen, video y audio, así como function calling nativo que los hace perfectos para agentes de IA.
¿Qué es Gemma 4?
Gemma 4 es una familia de modelos de código abierto publicada por Google DeepMind. Retoma los avances de la investigación Gemini 3 y los destila en modelos abiertos, descargables bajo licencia Apache 2.0. La familia ofrece varios tamaños, desde modelos muy compactos adaptados a despliegues edge y móvil hasta modelos más poderosos destinados a servidores. Todos los modelos están disponibles en versiones pre-entrenada e instruction-tuned, lo que cubre tanto usos en I+D como aplicaciones operacionales. La presencia de function calling nativo y un modo thinking configurable distingue a Gemma 4 de la mayoría de otras familias de código abierto, orientándolo claramente hacia agentes de IA y flujos de trabajo complejos.
Características principales
Gemma 4 introduce varios avances importantes. La arquitectura combina capas de atención local en ventana deslizante con capas de atención global, lo que asegura cobertura completa mientras optimiza los costos de inferencia. La ventana de contexto alcanza 128K tokens en las versiones pequeñas y 256K tokens en las versiones medianas, lo que permite procesar documentos largos o historiales extendidos sin truncamiento. Los modelos manejan nativamente texto, imágenes y videos, con excelente reconocimiento óptico de caracteres y buena comprensión de gráficos. Las versiones E2B y E4B añaden entrada de audio nativa para reconocimiento y comprensión de voz. El modo thinking, configurable, permite activar una cadena de razonamiento explícita cuando la tarea lo justifica, o generar directamente la respuesta para casos simples. El function calling nativo y el soporte del rol del sistema hacen de Gemma 4 una base ideal para agentes de IA. El rendimiento en benchmarks de código y agentividad muestra una mejora clara en comparación con Gemma 3.
Casos de uso
Gemma 4 cubre una amplia gama de escenarios. Los desarrolladores que apuntan a despliegues edge lo utilizan en aplicaciones móviles, extensiones de navegador o dispositivos embebidos, gracias a las versiones 2B y 4B compatibles con LiteRT-LM o Cactus. Los equipos de IA construyen agentes internos capaces de razonar y ejecutar herramientas, aprovechando el function calling nativo. Las empresas reguladas despliegan las versiones más grandes localmente para cumplir con requisitos de soberanía y auditabilidad. Los investigadores lo utilizan como base de experimentación para multilingüe, razonamiento largo o arquitecturas híbridas. Finalmente, los editores SaaS lo integran en sus productos para ofrecer una alternativa rentable a los modelos propietarios.
Ventajas
El beneficio principal de Gemma 4 está en la combinación de calidad, apertura y flexibilidad. La calidad se ilustra por la proximidad con los mejores modelos propietarios en benchmarks de referencia. La apertura, garantizada por la licencia Apache 2.0, permite fine-tuning, auditoría e implementación en cualquier entorno, incluyendo los más regulados. La flexibilidad proviene de la diversidad de la familia: una misma base tecnológica se ofrece desde móvil a cluster GPU, lo que simplifica la coherencia arquitectónica en una organización. El ecosistema de soporte es excepcional, con integraciones desde el día uno en Hugging Face, Ollama, vLLM, llama.cpp, MLX, NVIDIA NIM y muchos otros, lo que garantiza una portabilidad casi universal.
Precios
Gemma 4 es gratuito para descargar, bajo licencia Apache 2.0 que permite uso comercial sin restricciones. Los costos prácticos se ubicar únicamente en infraestructura de inferencia: GPUs para on-prem o tarificación por uso a través de proveedores cloud como Google Cloud, Hugging Face Inference, Baseten o Replicate. Esta ausencia de costos de licencia representa una ventaja económica significativa en comparación con modelos propietarios, particularmente para usos de alto volumen.
Conclusión
Gemma 4 ilustra el lugar central ocupado por el código abierto en la estrategia de Google DeepMind. La nueva familia aporta una combinación rara entre apertura total, calidad de referencia y cobertura excepcional de casos de uso. Para equipos de IA que construyen agentes, asistentes o productos de razonamiento avanzado, probablemente es la base de código abierto más interesante disponible en 2026.