Por Canuto  

Volcano Engine presentó en Beijing una nueva ola de modelos de inteligencia artificial encabezada por Doubao 2.1 Pro y el próximo Seedance 2.5, con un discurso centrado en capacidad productiva, costos más bajos y expansión hacia manufactura, robótica e inteligencia incorporada.
***

  • Volcano Engine dijo que Doubao 2.1 Pro superó un “punto de cambio cualitativo” para usos de producción en Coding, Agent y VLM.
  • La empresa prevé lanzar Seedance 2.5 en julio con video nativo de hasta 30 segundos y soporte para hasta 50 insumos multimodales.
  • Según la compañía, Doubao ya procesa más de 180 billones de tokens al día y Volcano Engine lidera el mercado chino de nube pública MaaS con 49,5%.


Volcano Engine presentó el 23 de junio en Beijing su conferencia FORCE Original Power Summer 2026, un evento en el que concentró anuncios sobre modelos de lenguaje, generación de video, imagen y audio, además de una actualización de su infraestructura de nube para agentes de IA.

La compañía situó a Doubao 2.1 Pro como su lanzamiento principal y adelantó que Seedance 2.5, su nuevo modelo de video, entrará en línea en julio con un enfoque claro hacia escenarios industriales y de inteligencia incorporada.

El trasfondo de este anuncio importa porque la competencia en IA ya no gira solo en torno a chatbots generales. Ahora el mercado observa qué modelos pueden sostener tareas largas, integrarse con herramientas, abaratar costos y operar en entornos empresariales reales.

En ese marco, Volcano Engine afirmó que sus nuevos modelos buscan resolver necesidades de producción concretas, desde programación avanzada hasta simulación de procesos, diseño visual y creación de audio para aplicaciones corporativas.

De acuerdo con la información difundida durante el evento, el ecosistema Doubao ya muestra una adopción considerable. La empresa indicó que más de 1,1 millones de empresas y usuarios individuales utilizan su servicio de grandes modelos a través de Huoshan Ark.

Doubao 2.1 Pro y el salto hacia escenarios de producción

Tan Dai, presidente de Volcano Engine, sostuvo que un modelo solo puede responder de verdad a la demanda empresarial y personal cuando cruza un “punto de cambio cualitativo” en sus capacidades de producción.

Según su planteamiento, el primer modelo de generación de video que alcanzó ese umbral a escala global fue Seedance 2.0. Para las áreas de Coding y Agent, identificó a Claude Opus 4.6 como la referencia que habría cruzado ese mismo punto.

Sobre esa base, Volcano Engine aseguró que Doubao 2.1 Pro ya superó ese umbral en tres frentes clave: Coding, Agent y VLM, siglas en inglés del modelo visual-lingüístico.

La compañía afirmó además que varias de sus métricas superan a Claude Opus 4.6. Esa comparación fue central en el mensaje del evento, donde el grupo buscó proyectar a Doubao como una opción de primer nivel para cargas de trabajo reales.

En las pruebas de código Terminal Bench 2.1, SWE-Pro y SciCode, Doubao 2.1 Pro quedó dentro de la primera línea de desempeño, según los datos compartidos por la empresa durante la conferencia.

En tareas de Agent y multimodalidad, Volcano Engine dijo que el modelo también figura entre los mejores del mundo en evaluaciones como OSWorld, MobileWorld y MMMU-Pro.

Ese lenguaje técnico puede parecer lejano para el lector común, pero en términos prácticos apunta a tres cosas. La primera es escribir y corregir código, la segunda es usar herramientas para ejecutar tareas y la tercera es comprender texto, imágenes y contexto visual de forma combinada.

La empresa trató de demostrar esa tesis con ejemplos de uso. Uno de ellos fue una prueba de diseño de chips en nivel RTL, donde Doubao 2.1 Pro habría operado casi 18 horas seguidas a lo largo de 9 iteraciones.

Según Volcano Engine, en ese ejercicio el sistema completó el flujo completo de ingeniería, incluidas simulación, pruebas y revisión de síntesis. La firma presentó ese caso como evidencia de entrega productiva en escenarios de ingeniería real.

Otro ejemplo mostrado en escena fue la construcción de una ciudad virtual 3D basada en Doubao 2.1 Pro. En esa simulación, más de 500 agentes inteligentes colaboraron de forma simultánea.

La demostración incluyó más de 1.000 llamadas a herramientas y la generación de más de 100 edificios. Con ello, la empresa intentó subrayar la escalabilidad del modelo para coordinación multiagente.

Precios, adopción y presión competitiva en el mercado chino de MaaS

Uno de los anuncios más agresivos del evento estuvo en el frente de precios. Volcano Engine informó que Doubao 2.1 Pro costará ¥ 6 por cada millón de tokens de entrada y ¥ 30 por cada millón de tokens de salida.

La empresa añadió que el precio con caché acertada se reduce a ¥ 1,2. Bajo esa estructura, aseguró que el costo integral de uso se ubica casi 80% por debajo de Claude Opus 4.6.

Para escenarios de llamadas frecuentes, Volcano Engine también presentó Doubao 2.1 Turbo. Ese producto tendrá un precio equivalente a la mitad del de Doubao 2.1 Pro, según lo informado en la conferencia.

La compañía indicó además que puso en marcha la versión Doubao-Seed-Evolving, dirigida a los entornos de Coding y Agent. Su plan es iterarla con una frecuencia de 2 a 4 actualizaciones por mes.

Ese ritmo refleja una tendencia más amplia del sector. Los proveedores de IA están dejando atrás los ciclos largos de lanzamiento y se mueven hacia mejoras continuas, con ajustes rápidos para no perder tracción frente a rivales locales e internacionales.

Volcano Engine señaló que los modelos Doubao 2.1 ya están disponibles mediante su servicio de API abierta. También detalló que se irán integrando en productos como Doubao, TRAE y Kouzi.

En paralelo, la empresa presentó cifras de escala que buscan reforzar su posición competitiva. Hasta junio de este año, dijo que las llamadas diarias de tokens del gran modelo Doubao ya superan los 180 billones.

Esa cifra, de acuerdo con la compañía, representa un crecimiento de más de 10 veces frente al año anterior. El dato sugiere una fuerte expansión del uso comercial y de desarrolladores, aunque la empresa no desglosó cuánto corresponde a cada segmento.

La firma también citó datos de IDC para respaldar su liderazgo comercial. Según esa referencia, Volcano Engine ocupa el primer lugar del mercado chino de servicios MaaS sobre nube pública con una participación de 49,5%.

Para dimensionar la importancia del dato, MaaS significa Model as a Service. En la práctica, se refiere a plataformas que permiten a empresas consumir modelos de IA desde la nube sin construir toda la infraestructura desde cero.

Volcano Engine agregó que ya hay 200 empresas con llamadas anuales superiores a 1 billón de tokens en Huoshan Ark. Esa cantidad se duplicó en seis meses y abarca sectores como internet, manufactura, finanzas y automoción.

Seedance 2.5, Seedream 5.0 Pro y Seed-Audio 1.0 amplían la ofensiva multimodal

La otra gran novedad del encuentro fue la primera aparición pública de Seedance 2.5. Volcano Engine prevé habilitar este modelo de video en julio, con mejoras orientadas a producción audiovisual y casos de uso industriales.

Según la empresa, Seedance 2.5 podrá generar de forma nativa clips de video de hasta 30 segundos en un solo segmento. También soportará la generación conjunta a partir de hasta 50 materiales multimodales.

La tercera mejora anunciada es la edición local con preservación de consistencia visual. Ese punto es relevante para empresas que necesitan retocar una escena sin alterar personajes, objetos o estilo entre cuadros.

Tan Dai dijo que la generación de video es una de las rutas hacia los llamados modelos de mundo. Con esa idea, defendió que esta tecnología tiene un potencial importante en industrias físicas y no solo en entretenimiento o publicidad.

Volcano Engine sostuvo que Seedance ya fue implementado en campos como inteligencia incorporada, manufactura industrial y conducción inteligente. Los usos mencionados incluyen síntesis de datos, simulación de escenas y demostración de procesos.

En términos simples, eso implica crear entornos visuales de entrenamiento o validación para máquinas y software. También permite representar operaciones complejas sin montar cada escenario físico desde cero.

La empresa presentó además Seedream 5.0 Pro, su nuevo modelo de creación de imágenes. Entre sus capacidades destacadas mencionó edición precisa interactiva, separación de múltiples capas y expresión de información densa.

Volcano Engine añadió que Seedream 5.0 Pro puede generar texto multilingüe de forma nativa. También puede producir directamente diseños editables por capas e infografías complejas.

En audio, la firma mostró Seed-Audio 1.0. Según su descripción, el modelo cuenta con capacidades de referencia multimodal de cero disparos.

Ese sistema puede generar de una sola vez diálogos con varios personajes, música de fondo y efectos de sonido foley. La propuesta apunta a automatizar piezas sonoras más completas dentro de un mismo flujo de trabajo.

Infraestructura para la era Agent y lectura estratégica del anuncio

Más allá de los modelos, Volcano Engine dedicó una parte importante del evento a su infraestructura de nube para agentes. La empresa volvió a actualizar su arquitectura AI cloud-native con foco en la era Agent.

Entre las herramientas anunciadas figura Ark CLI, una utilidad de línea de comandos. Su promesa es permitir que un desarrollador conecte un agente a Huoshan Ark con una sola instrucción.

La compañía también informó mejoras en AgentKit y HiAgent 3.0. A esto sumó ArkClaw Enterprise Edition Agent Workbench y un sistema de productos agrupados bajo la marca AI Trust.

El objetivo declarado es fortalecer tanto la base operativa como la seguridad de las aplicaciones empresariales con agentes. Ese aspecto se ha vuelto central a medida que las compañías intentan dar más autonomía a sistemas capaces de llamar herramientas y ejecutar flujos complejos.

Para una audiencia interesada en IA, mercados y tecnología, el anuncio deja varias lecturas. La primera es que la competencia se está trasladando desde los benchmarks generales hacia pruebas de resistencia, integración y costo efectivo.

La segunda es que China sigue profundizando su propia carrera por el liderazgo en modelos fundacionales y servicios de inferencia empresarial. El discurso de Volcano Engine mezcla soberanía tecnológica, escalabilidad comercial y presión de precios frente a referentes occidentales.

La tercera lectura es sectorial. Los casos de uso destacados por la empresa se concentran en manufactura, automoción, simulación y robótica, áreas donde la generación multimodal puede convertirse en una herramienta de entrenamiento y validación con impacto económico directo.

Por ahora, el mercado tendrá que esperar al lanzamiento formal de Seedance 2.5 en julio para evaluar su rendimiento fuera del escenario de presentación. También será clave observar si las promesas de costo y desempeño de Doubao 2.1 Pro se traducen en mayor adopción empresarial.

Lo que sí queda claro es que Volcano Engine quiere jugar en la primera división global de IA aplicada. Y está tratando de hacerlo con una combinación de multimodalidad, agentes, precios bajos y una narrativa de uso productivo real.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín