Por Canuto  

Google presentó Nano Banana 2 Lite y abrió Gemini Omni Flash a desarrolladores, dos modelos con los que busca acelerar la creación de imágenes y video con IA, bajar costos operativos y facilitar flujos de trabajo multimedia encadenados desde una sola sesión.
***

  • Nano Banana 2 Lite genera imágenes en 4 segundos y tiene un costo de USD $0,034 por 1.000 imágenes de resolución 1K.
  • Gemini Omni Flash llega a Google AI Studio y la Gemini API con generación y edición conversacional de video por USD $0,10 por segundo.
  • Google impulsa casos de uso de alto volumen, desde diseño e ideación hasta comercio electrónico, con marcación mediante SynthID.


Google anunció dos lanzamientos enfocados en acelerar la construcción de experiencias multimedia con inteligencia artificial. La empresa presentó Nano Banana 2 Lite, su modelo de imagen Gemini más rápido y de menor costo, y además abrió Gemini Omni Flash a los desarrolladores para generación y edición de video.

La apuesta apunta a un problema muy concreto del mercado de IA generativa. Crear productos visuales útiles no solo depende de la calidad del resultado final, sino también de la velocidad de iteración, la consistencia entre activos y el costo de escalar esos procesos.

Según explicó Google en una publicación oficial, ambos modelos ya están disponibles en Google AI Studio, la Gemini API y Gemini Enterprise Agent Platform. En paralelo, también comenzaron a desplegarse en varias superficies de consumo de la compañía, incluida la aplicación Gemini.

El mensaje de fondo es claro. Google quiere que los desarrolladores puedan encadenar generación rápida de imágenes con creación y edición de video dentro de flujos de trabajo creativos de múltiples turnos, sin depender de herramientas separadas.

Para un mercado cada vez más competido en IA generativa, este tipo de integración importa tanto como las métricas puras de rendimiento. También marca un movimiento relevante para sectores como publicidad, comercio electrónico, diseño, productividad y herramientas empresariales.

Nano Banana 2 Lite: velocidad y ahorro para flujos de alto volumen

Nano Banana 2 Lite, identificado como gemini-3.1-flash-lite-image, fue presentado como el modelo de imágenes más rápido y rentable de la familia Nano Banana. Google lo posiciona para ideación rápida y flujos de desarrollo de alta velocidad donde la latencia y el presupuesto pesan más que el refinamiento extremo.

La compañía recomendó este modelo como reemplazo directo de su primera versión de Nano Banana, conocida como gemini-2.5-flash-image. Ese detalle es relevante porque sugiere una actualización práctica e inmediata para desarrolladores que ya usan herramientas visuales de Google en producción.

Entre las cifras destacadas, Google afirmó que Nano Banana 2 Lite entrega salidas de texto a imagen en 4 segundos. Ese tiempo lo vuelve especialmente atractivo para prototipado interactivo, borradores visuales y sistemas que requieren respuestas casi en tiempo real.

El otro argumento fuerte es el precio. Google fijó el costo en USD $0,034 por 1.000 imágenes de resolución 1K, una métrica con la que busca seducir a equipos que manejan grandes volúmenes, presupuestos ajustados o limitaciones de ancho de banda.

Aunque prioriza rapidez y eficiencia, la empresa sostuvo que el modelo conserva buena adherencia a los prompts, consistencia de personajes y una representación de texto legible dentro de la imagen. Ese punto es clave porque muchos modelos rápidos suelen sacrificar justamente esos aspectos.

Google también mostró la lógica interna de su portafolio visual al describir la familia Nano Banana por niveles. Nano Banana 2 Lite queda como la opción ultrarrápida, mientras Nano Banana 2 opera como modelo generalista y Nano Banana Pro se orienta a tareas complejas donde la precisión importa más que la velocidad.

En esa misma clasificación, el modelo original de Nano Banana pasa a ser un producto legado. La compañía recomendó migrar hacia 2 Lite para obtener mejor calidad, mayor velocidad y costos más bajos, una combinación que en la práctica busca reducir fricción para la adopción.

Además de su disponibilidad para desarrolladores, Nano Banana 2 Lite comenzó a llegar a productos orientados a usuarios finales. Google mencionó AI Mode en Search, la app Gemini, NotebookLM, Google Photos, Stitch, Google Flow y Google Ads.

Gemini Omni Flash: video conversacional con precio competitivo

El segundo gran anuncio fue la expansión de Gemini Omni Flash hacia desarrolladores. Google ya lo había presentado en I/O como el modelo donde el razonamiento multimodal de Gemini se combina con generación y edición de video.

Ahora, bajo la denominación gemini-omni-flash-preview, el sistema queda disponible por primera vez en Google AI Studio y la Gemini API. El modelo soporta de forma nativa generación de video de alta calidad y edición conversacional a partir de texto, imágenes y videos.

La empresa fijó su precio en USD $0,10 por segundo de salida de video. También señaló que esa cifra equivale al costo de Veo 3.1 Fast, con lo cual intenta posicionarlo como una alternativa competitiva dentro de su propio ecosistema audiovisual.

Google destacó cuatro fortalezas principales de Omni Flash. La primera es la edición de video mediante lenguaje natural, lo que permite refinar secuencias con instrucciones conversacionales en lugar de recurrir a flujos más rígidos o técnicos.

La segunda es la referencia multimodal. En términos simples, el modelo puede combinar imágenes, texto y video como entradas para mantener control y coherencia sobre una escena, algo esencial para campañas, demostraciones de producto o storytelling secuencial.

La tercera fortaleza es el uso del conocimiento del mundo real de Gemini. Google afirmó que Omni puede apoyarse en campos como historia, biología y lógica narrativa para construir videos más atractivos y con mejor contexto.

La cuarta ventaja señalada es la sincronización entre texto y acción. Según la empresa, el modelo puede conectar textos y gráficos directamente con acciones del video a través de prompting simple, una capacidad valiosa para tutoriales, marketing visual y experiencias interactivas.

Pese al impulso comercial, Google también reconoció límites técnicos importantes. Por ahora, Omni Flash genera videos de 10 segundos, aunque la empresa aseguró que duraciones más largas estarán disponibles pronto.

La carga de referencias de audio y la extensión de escenas todavía no son compatibles en la Gemini API para este modelo. Además, las referencias de video de hasta 3 segundos son aceptadas por el esquema de API, pero aún no se procesan correctamente en el modelo.

La compañía añadió otra limitación que puede pesar en producción. La consistencia de personajes cuando cambian las escenas o cuando hay movimientos de paneo todavía presenta restricciones, aunque Google aseguró que trabaja en mejorarlo.

Una estrategia de cadena creativa de extremo a extremo

Más allá de los anuncios por separado, Google puso énfasis en el valor de encadenar ambos modelos. La idea es usar Nano Banana 2 Lite para generar imágenes con rapidez y luego pasar esas imágenes a Gemini Omni Flash como referencias para convertirlas en video.

Ese diseño responde a una necesidad concreta del mercado. Muchas experiencias de IA generativa no fallan por la calidad de un modelo aislado, sino por la dificultad de unir varias etapas creativas sin perder contexto, consistencia ni tiempo.

Google señaló que, al usar la API Interaction para experiencias de múltiples turnos, los desarrolladores pueden mantener historial y contexto de sesión. Eso permitiría a los usuarios acumular hasta tres ediciones secuenciales dentro del mismo flujo.

La empresa acompañó el lanzamiento con varias aplicaciones de demostración reutilizables. Con ello busca reducir la distancia entre el anuncio técnico y la experimentación real, un paso clave para impulsar adopción en startups, estudios creativos y equipos corporativos.

Una de esas demos se llama Anywhere. La aplicación toma una selfie o una foto subida por el usuario, usa Nano Banana 2 Lite para transportarlo a decenas de monumentos icónicos y luego activa Omni Flash para animar la imagen generada en un clip de la ubicación.

Otra demo es Space Lift, enfocada en diseño de interiores. Allí, el usuario sube una foto de una habitación y la aplicación genera conceptos completos en varias estéticas de diseño, para luego convertir la opción elegida en una presentación cinematográfica en movimiento.

Google también mostró Omni product studio, una aplicación orientada a comercio electrónico. En ese caso, Nano Banana 2 Lite crea imágenes estáticas y Gemini Omni las transforma en videos cinematográficos de producto.

Ese tipo de flujo puede resultar especialmente útil en verticales donde el contenido visual se produce en masa. Publicidad digital, catálogos comerciales, social media y marketplaces suelen valorar más una combinación de velocidad, costo y consistencia que una perfección aislada en cada fotograma.

Seguridad, transparencia y despliegue en el ecosistema de Google

Google indicó que tanto Gemini Omni como Nano Banana 2 Lite se apoyan en su infraestructura segura y usan SynthID para marcación. La empresa viene promoviendo esta tecnología como una forma de identificar contenido generado por IA sin alterar visiblemente la experiencia del usuario.

La verificación de contenido de IA podrá hacerse a través de la app Gemini, Gemini en Chrome o Search. Ese componente de transparencia gana peso a medida que imágenes y videos sintéticos se integran en entornos de uso masivo y de alta circulación pública.

El movimiento también tiene una lectura regulatoria y reputacional. A medida que la IA generativa se vuelve más accesible y barata, crece la presión sobre las plataformas para ofrecer herramientas que ayuden a entender cómo fue creado o editado un contenido.

En paralelo, el despliegue en productos de consumo muestra que Google no está separando su estrategia empresarial de su estrategia minorista. Los mismos modelos que llegan a desarrolladores también se integran en servicios con millones de usuarios.

Eso podría acelerar el aprendizaje del mercado y la normalización de estas interfaces. También podría reforzar el ecosistema Gemini frente a competidores que aún mantienen divisiones más marcadas entre herramientas de laboratorio, productos empresariales y aplicaciones de consumo.

Desde la óptica de negocios, el anuncio confirma que el campo de batalla ya no es solo la capacidad del modelo base. Ahora también importan la latencia, el costo por unidad generada, la integración en APIs, la edición conversacional y las garantías de trazabilidad del contenido.

Para desarrolladores y empresas, la decisión de adoptar estos modelos dependerá menos del entusiasmo por la novedad y más de la utilidad práctica. Google intenta responder a esa exigencia con métricas directas, demos funcionales y una ruta clara de integración.

Con Nano Banana 2 Lite y Gemini Omni Flash, la empresa busca convertir la creación multimedia con IA en una cadena más rápida, más económica y más continua. Si esa promesa se sostiene en producción, el impacto puede sentirse tanto en herramientas creativas como en productos comerciales de gran escala.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín