Así funcionan los nuevos modelos multimedia de IA generativa de Google: conocé a Veo 3, Imagen 4 y Flow

El vertiginoso desarrollo de las nuevas tecnologías no nos da un respiro, pero sobre todo aquellas que se relacionan con inteligencia artificial generativa. Google no quiere perder su posición y nos lo confirmó con su Google I/O 2025 celebrado esta semana. Allí lanzó su nueva forma de búsqueda llamada AI Mode, por ejemplo. Y, por supuesto, anunció sus más recientes modelos y herramientas multimedia generativos: Veo 3, Imagen 4, Flow, junto con mejoras para Veo 2.

La creatividad es hoy uno de los recursos más explotados en el mundo, y las industrias culturales producen sin cesar, proponiéndose romper con los límites de lo posible para impactar al público. Pero los productos de Google no se enfocan solo en el sector formal, sino que, como lo ha promocionado desde sus orígenes, considera que sus aplicaciones conducen a una democratización. Primero del conocimiento y las tecnologías y, ahora, también de la creatividad.

Sea como sea en la práctica, los nuevos productos se han desarrollado con la colaboración de cineastas, músicos, artistas y creadores de YouTube, tal como lo indica el comunicado. Veamos qué hace cada uno.

Veo 3, le contás una historia y te devuelve video + audio

Si hoy te impresiona cómo han evolucionado los deepfakes, y su consecuente poder de influencia en, por ejemplo, las campañas políticas, esto te va dejar con la boca abierta. Veo 3 no solo supera al modelo de Veo 2, sino que también te permite generar videos con audio con una sincronización de labios increíble en un diálogo entre personajes, por ejemplo.

Este clip te mostrará la calidad de la producción que tiene Veo 3. La escena es un marinero a bordo, con una pipa en las manos, dando un monólogo mientras las olas se mueven en el fondo:

[embedded content]

375_142 Así funcionan los nuevos modelos multimedia de IA generativa de Google: conocé a Veo 3, Imagen 4 y Flow

Los detalles pueden ser tan complejos como quieras: ruido del tráfico en la calle de una avenida, pájaros cantando en una plaza, sonido ambiente en una oficina, o una conversación entre varios personajes. El programa tiene un razonamiento tal que, si le contás una historia con instrucciones, el modelo puede generar un clip que la hace realidad.

También hay grandes mejoras en Veo 2, como la posibilidad de brindarle a la IA imágenes de personajes, escenas, objetos y estilos, lo que te permitirá tener más control creativo. También vas a poder controlar la cámara para definir movimientos precisos, como rotaciones, dollies y zooms; adaptar tu video a cualquier tamaño de pantalla y agregar y quitar objetos.

Por ahora, Veo 3 está disponible actualmente en la aplicación de Gemini y en Flow para suscriptores de Ultra de Estados Unidos, y en Vertex AI para usuarios corporativos.

Flow, para crear cine con IA de una manera muy sencilla

Es, básicamente, una herramienta que te permite crear historias, escenas y clips cinematográficos sin esfuerzo, ya que integra los modelos más avanzados de Google DeepMind: Veo, Imagen y Gemini.

Solamente tenés que introducir una instrucción con lenguaje natural, y como con Veo 2, podés compartirle los elementos para tu historia (reparto, locaciones, objetos y estilos). Verás cómo tu narración cobra vida al instante. Queda clarísimo que, con Flow, las posibilidades son infinitas. Si tenés dudas, basta con mirar el tráiler que preparó Google:

[embedded content]

Imagen 4, detalles increíbles, amplitud de estilos y resolución de 2K

El último modelo es Imagen 4, que ofrece ha perfeccionado los detalles sutiles como lo son los diseños textiles complejos, las gotas de agua y el pelaje de animales. En estilos, se destaca en los fotorrealistas y los abstractos.

450_1000 Así funcionan los nuevos modelos multimedia de IA generativa de Google: conocé a Veo 3, Imagen 4 y Flow

Te permite generar imágenes en una amplia variedad de relaciones de aspecto y con una resolución de hasta 2K, algo positivo a la hora de imprimir. Imagen 4 está disponible en la aplicación de Gemini, Whisk y Vertex AI, y en Presentaciones, Vids, Documentos y mucho más en Workspace. Además, también anunciaron que lanzarán una variante que será 10 veces más veloz que Imagen 3.

Para asegurar la creación responsable con la comunidad creativa, Google pone marcas de agua con SynthID en todos los resultados generados por Veo 3, Imagen 4 y Lyria 2. Además, también acaban de lanzar SynthID Detector, un portal de verificación para ayudar a identificar ese contenido generado por IA, algo que se ha convertido en un dilema moral y tensiona actualmente al campo de las industrias culturales.

Fuente: Xataka.com.ar

Share this content: