La nueva tecnología de IA de Google puede crear vídeos cortos a partir de una sola imagen

Rubén Castro, 23 agosto 2022

Ya han comenzado las ofertas de BlackFriday en AliExpress! Te dejo una guía con las mejores ofertas y los mejores códigos de descuento!!!

Ver cómo aprovechar las ofertas

Los investigadores no dejan de idear nuevas aplicaciones para la IA y el ML a medida que estos campos avanzan. Google ha lanzado recientemente un nuevo marco llamado Transframer, que puede crear cortometrajes a partir de una sola imagen. Con este nuevo enfoque, los ingenieros de software podrán generar mundos virtuales mediante el aprendizaje automático.


Tanto el nombre como el concepto del nuevo marco hacen referencia al modelo Transformer basado en IA. El diseño de red neuronal conocido como Transformer se desarrolló en 2017 y se utiliza para generar texto modelando y comparando las palabras de las frases. Tanto TensorFlow como PyTorch se han actualizado para incorporar el modelo.

Para crear cortos como Transformer, Transframer utiliza fotos del mismo contexto junto con una consulta de anotación. A pesar de la escasez de datos geométricos, las películas que se generan se mueven alrededor de la imagen de destino y proporcionan perspectivas adecuadas.

La nueva técnica propuesta, que hace uso de la plataforma de IA DeepMind desarrollada por Google, examina una única fotografía de contexto para producir otras. Este método examina el borde de la foto para hacer predicciones sobre su entorno.

Después, las fotos de contexto se utilizan para hacer predicciones sobre los ángulos de la imagen. La predicción crea nuevos fotogramas de la imagen modelándolos sobre la base de los datos, las anotaciones y otros fotogramas de contexto.

Dado que puede generar vídeos correctos a partir de una cantidad restringida de información, el marco representa un importante paso adelante en el desarrollo de la tecnología de vídeo. Además, los resultados de las tareas de transframer para la segmentación semántica, la clasificación de imágenes y las predicciones de flujo óptico han demostrado ser prometedores.

La industria de los videojuegos y otras industrias basadas en el vídeo podrían verse afectadas de forma significativa. El sombreado, el mapeado de texturas, la profundidad de campo y el trazado de rayos son algunas de las herramientas utilizadas en los entornos de desarrollo de juegos. Transframer reduce la cantidad de tiempo, recursos y esfuerzo que se requiere para construir espacios de trabajo para los desarrolladores mediante el uso de la IA y el aprendizaje automático.