Página de inicio :Juega con la tecnología, mira el futuro a tu manera

El modelo de video AI Veo 3 de Google enfrenta problemas con la precisión de los subtítulos

El modelo de IA para la generación de video de Google, Veo 3, enfrenta problemas con la precisión de los subtítulos, ya que a menudo genera subtítulos confusos incluso cuando se solicita que no se incluyan.

Última actualización

El modelo de generación de video más reciente de Google, Veo 3, fue lanzado a finales de mayo y rápidamente se convirtió en una herramienta popular entre los creativos. Veo 3 permite a los usuarios generar sonidos y diálogos por primera vez, lo que ha dado lugar a una avalancha de clips hiperrealistas de ocho segundos utilizados en anuncios, videos ASMR, tráileres de películas imaginarios e incluso entrevistas callejeras humorísticas. El director nominado al Premio de la Academia, Darren Aronofsky, usó la herramienta para crear el cortometraje titulado 'Ancestra'. Durante una rueda de prensa, Demis Hassabis, CEO de Google DeepMind, comparó este avance con "salir de la era silenciosa de la generación de videos".

Sin embargo, algunos usuarios rápidamente notaron que la herramienta no siempre funcionaba como se esperaba. Cuando genera clips con diálogos, Veo 3 a menudo agrega subtítulos incoherentes y desordenados, incluso cuando las indicaciones dadas explícitamente solicitan que no se incluyan subtítulos. Este problema de precisión de los subtítulos ha llamado la atención de muchos usuarios, lo que podría afectar la utilidad de la herramienta en proyectos profesionales.