Imagina que abres el móvil y, en cuestión de segundos, te ves a ti mismo dentro de una escena totalmente nueva, como si fueras el protagonista de un vídeo real, con movimientos naturales y rebotes creíbles. Solo necesitas grabar un corto para captar tu voz y rostro, y la aplicación te “sitúa” automáticamente en el escenario. Lo sorprendente es el nivel de control que tienes: puedes enlazar diferentes tomas y mantener el ambiente intacto sin que nada se rompa. Así funciona Sora 2.
Para entender bien qué representa Sora 2, hay que remontarse a 2022, cuando ChatGPT puso la generación de texto en el centro de la atención tecnológica. Luego llegaron los modelos de imágenes y, en febrero de 2024, la primera versión de Sora, que ya mostraba persistencia de objetos y cierta coherencia visual. Pronto la competencia respondió con proyectos como Runway Gen-4, dando inicio a un mercado muy dinámico que ahora recibe un nuevo impulso con esta actualización.
¿Qué tiene de nuevo Sora 2? OpenAI lo compara con el salto que supuso GPT-3.5 para la generación de texto. La gran diferencia está en la física realista: por ejemplo, si una pelota falla el aro, rebota sobre el tablero, en lugar de “teletransportarse” como ocurría antes. Además, puede mantener el estado de una escena entre planos y seguir instrucciones más complejas. También integra generación de voces, efectos y paisajes sonoros, lo que la convierte en una herramienta mucho más completa para vídeo y audio.
Junto con el modelo, OpenAI lanza una app con un enfoque social. Después de una rápida verificación de rostro y voz, puedes aparecer como cameo en cualquier escena y compartirlo con tus amigos. La aplicación permite remezclar vídeos de otros usuarios y navegar por un feed personalizado que responde a tus preferencias mediante lenguaje natural. La experiencia está pensada para impulsar la creación colaborativa, no el consumo pasivo, y por ahora solo se puede acceder bajo invitación en iOS.
En cuanto a bienestar y seguridad, OpenAI insiste en que la aplicación no busca enganchar a los usuarios en un scroll infinito. Está diseñada para dar prioridad a personas conocidas y fomentar la creación más que el consumo. Para adolescentes hay límites básicos, como restricciones en la cantidad de creaciones y permisos más estrictos para los cameos. También ofrecen controles parentales desde ChatGPT y la posibilidad de eliminar cualquier uso no deseado de tu imagen. Habrá moderadores humanos para actuar en casos de acoso.
¿Es gratis? De momento, Sora 2 se lanza de forma gradual en iOS, empezando por Estados Unidos y Canadá. Está previsto que llegue a más países, aunque en España aún no está disponible. Se accede solo por invitación y el servicio inicial es gratuito, con límites que dependen de la capacidad de procesamiento. Los suscriptores de ChatGPT Pro, que pagan unos 200 dólares al mes, tendrán acceso a una versión Pro de Sora 2 con mejor calidad. Además, OpenAI planea ofrecer el modelo vía API.
No todo es perfecto todavía. En los vídeos promocionales se ven escenas con combates de anime, exploradores enfrentándose a una tormenta de nieve o acrobacias que en ocasiones parecen un poco rígidas o que desafían la gravedad. Sin embargo, el modelo logra que esos errores parezcan parte del personaje, no fallos técnicos. OpenAI admite que todavía hay muchos errores y que la coherencia general no es perfecta, pero el avance respecto a la versión inicial es notable.
Con Sora 2, los vídeos dejan de ser solo un producto para ver y pasan a ser un espacio para jugar y crear en conjunto. La clave está en la posibilidad de convertir a cualquiera en protagonista de un clip listo para compartir. Puede que sea una moda pasajera o el inicio de una etapa con más creatividad participativa. Lo que sí parece claro es que OpenAI vuelve a poner el foco en el usuario cotidiano, como hizo con ChatGPT o con las imágenes estilo Studio Ghibli, ofreciendo una propuesta pensada para generar oleadas de contenido viral.



