Lyra 2.0 (Nvidia)

Generación de mundos 3D persistentes desde una simple foto, en open source.

💰Gratuito (open source) ★★★★★ 4,8/5 (89 opinión)
Creación Vídeo
#B-roll & vídeo stock #Open source #Storyboards #Text-to-video

Vista previa de Lyra 2.0 (Nvidia)

https://research.nvidia.com/labs/sil/projects/lyra2/
Captura de pantalla de Lyra 2.0 (Nvidia)
Visitar Lyra 2.0 (Nvidia) →

Presentación detallada

Lyra 2.0 es un __framework open source__ desarrollado por el Nvidia Spatial Intelligence Lab que transforma una sola imagen en __mundo 3D persistente y explorable__. El sistema se apoya en un modelo de difusión de video, genera una trayectoria de cámara controlada luego reconstruye el resultado en __3D Gaussian Splats__ y meshes. Distribuido bajo licencia Apache 2.0 con pesos y código disponibles en Hugging Face y GitHub, se puede usar para simulación robótica, storyboarding y creación inmersiva.

¿Qué es Lyra 2.0 (Nvidia)?

Lyra 2.0 es un framework de investigación open source dedicado a la generación de mundos 3D persistentes a partir de imágenes. Donde otros enfoques producen secuencias de video limitadas en tiempo, Lyra 2.0 apuesta por la coherencia espacial y temporal para ofrecer un entorno explorable en tiempo real, exportable hacia motores como NVIDIA Isaac Sim. El proyecto está pilotado por el Nvidia Spatial Intelligence Lab y publicado bajo licencia Apache 2.0, con todo el código y pesos disponibles en Hugging Face y GitHub. Esta apertura lo convierte en una referencia tanto para investigación académica como para la industria que quiere integrar generación 3D en productos.

Características principales

Lyra 2.0 propone varias innovaciones técnicas. El pipeline parte de una sola imagen fuente y genera un video de trayectoria de cámara usando un modelo de difusión de video basado en Wan 2.1-14B. Este video se reconstruye luego en 3D Gaussian Splats y meshes, permitiendo exploración en tiempo real y exportación hacia motores físicos. Para resolver problemas clásicos de coherencia, Lyra 2.0 introduce dos ideas fuertes: una geometría por imagen para el enrutamiento de información, que reduce la pérdida espacial, y un entrenamiento auto-aumentado que enseña al modelo a corregir sus propias derivas temporales. El resultado es un entorno más estable, más coherente y más utilizable que enfoques anteriores. El framework integra herramientas para exportar fácilmente escenas hacia Isaac Sim, abriendo el camino a entrenamientos robóticos basados en entornos generados. Lyra 2.0 se apoya en un pipeline modular que investigadores pueden extender, modificar o combinar con otros modelos. La distribución open source se acompaña de scripts de inferencia, modelos pre-entrenados y notebooks de ejemplo para facilitar la adopción.

Casos de uso

Lyra 2.0 aborda varios perfiles de creadores e investigadores. Los laboratorios de robótica la utilizan para entrenar sus agentes en entornos 3D generados a gran escala, reduciendo la dependencia de escaneos físicos costosos. Los estudios de videojuegos y realidad virtual la explotan para producir decorados preliminares o entornos experimentales. Los equipos de producción cinematográfica la utilizan para storyboarding inmersivo, transformando conceptos en escenas explorables antes del rodaje. Los investigadores en computer vision integran el framework en sus propios pipelines para estudiar coherencia espacial y temporal. Los creadores en realidad aumentada finalmente exploran la posibilidad de generar entornos personalizados desde imágenes de referencia.

Ventajas

Adoptar Lyra 2.0 aporta varios beneficios para usuarios avanzados. La rapidez de producción de escenas 3D explorables es radicalmente superior a pipelines tradicionales, que requieren modelado, texturizado e iluminación manuales. La licencia Apache 2.0 autoriza uso comercial sin restricción, lo que hace el framework atractivo para startups y editores. La compatibilidad con herramientas Nvidia como Isaac Sim simplifica la integración en cadenas existentes. La calidad espacial y temporal mejora la fiabilidad de entornos para simulación y entrenamiento de agentes IA. Finalmente, la apertura del código y pesos favorece una comunidad activa que contribuye a la evolución del framework y propone optimizaciones adaptadas a diferentes hardwares.

Precios

Lyra 2.0 es un proyecto open source distribuido gratuitamente bajo licencia Apache 2.0. El código está disponible en GitHub, los pesos en Hugging Face, y el uso local o cloud del framework no requiere licencia comercial adicional. Los costos asociados conciernen esencialmente los recursos GPU necesarios para inferencia o entrenamiento, que pueden ser importantes según los casos de uso. Para equipos sin su propia infraestructura, proveedores cloud como AWS, GCP o plataformas especializadas ofrecen GPUs H100 o equivalentes adaptadas a estas cargas.

Conclusión

Lyra 2.0 es un avance importante para generación de mundos 3D desde imágenes. Su apertura, calidad e integración en el pipeline Nvidia lo hacen un framework de referencia para investigación y algunos usos industriales. Para usuarios del público general, la herramienta seguirá siendo demasiado técnica, pero para estudios, laboratorios y equipos ML ambiciosos, es imprescindible.

❓ PREGUNTAS FRECUENTES

PREGUNTAS FRECUENTES — Lyra 2.0 (Nvidia)

¿Qué es Lyra 2.0?
Lyra 2.0 es un framework open source de Nvidia que transforma una sola imagen en mundo 3D persistente y explorable, exportable en Gaussian Splats.
¿Es Lyra 2.0 gratuito?
Sí, Lyra 2.0 se distribuye bajo licencia Apache 2.0 con pesos del modelo disponibles en Hugging Face y código en GitHub.
¿Para qué sirve Lyra 2.0?
Lyra 2.0 se usa para simulación robótica, creación VR, storyboarding 3D e investigación en computer vision.
¿Se necesita un GPU para usar Lyra 2.0?
Sí, el uso local del framework requiere GPUs potentes, como es el caso para modelos de difusión de video modernos.
¿Se puede usar Lyra 2.0 comercialmente?
Sí, la licencia Apache 2.0 autoriza uso comercial, lo que abre la puerta a integraciones en productos y servicios.
★★★★★ 4.8/5 (89 opiniones)
✅ Verificado por Comparateur-IA
Creación Vídeo

Generación de mundos 3D persistentes desde una simple foto, en open source.

💰 Tarifa Gratuito (open source)
🆓 Prueba gratuita
🌐 Idiomas 🇬🇧 English
Visitar el sitio →
🔗 Descubre también

Recursos relacionados

Este sitio está registrado en wpml.org como sitio de desarrollo. Cambia a una clave de sitio de producción en remove this banner.