Por Hannah Pérez  

Compañías chinas como ByteDance y Kuaishou estarían superando a rivales estadounidenses en generación de video mediante IA, impulsadas por enormes bibliotecas de contenido y modelos que destacan en realismo, velocidad y costos.

***

  • Modelos chinos como Kling y Seedance 2.0 ganan terreno frente a herramientas de OpenAI y Google.
  • TikTok y otras plataformas de video corto habrían dado ventaja clave a empresas chinas.
  • La generación de video con IA comienza a transformar publicidad y ecommerce.


La competencia global por el liderazgo en inteligencia artificial (IA) ha comenzado a fragmentarse en distintas categorías. Mientras compañías estadounidenses como OpenAI, Google y Anthropic continúan dominando el terreno de los modelos de lenguaje y programación, China parece estar tomando la delantera en otro frente clave: la generación de video mediante IA.

Así lo reportó el Financial Times, que señala que gigantes tecnológicos chinos como ByteDance y Kuaishou Technology están superando a competidores occidentales en calidad, realismo y escalabilidad de modelos de video generativo.

Según desarrolladores y rankings independientes citados en el informe, las herramientas chinas habrían logrado avances significativos gracias a su acceso privilegiado a enormes volúmenes de videos cortos provenientes de plataformas como TikTok y otras aplicaciones masivas de contenido audiovisual.

La evolución ocurre en un momento en que la IA generativa comienza a expandirse rápidamente en industrias como publicidad, comercio electrónico y entretenimiento, sectores donde la creación automatizada de video podría alterar radicalmente costos y procesos de producción.

La ventaja china también refleja una diferencia estructural importante respecto a Occidente: mientras los modelos de texto pueden entrenarse con grandes volúmenes de contenido disponible públicamente, el entrenamiento de sistemas de video requiere enormes bibliotecas audiovisuales de alta calidad, un recurso mucho más difícil de obtener y escalar.

Kling y Seedance emergen como referentes del sector

Entre las plataformas que más atención están generando destacan Kling, desarrollada por Kuaishou, y Seedance 2.0, creada por ByteDance.

Ben Chiang, fundador de la startup Director AI, afirmó que la mayoría de modelos estadounidenses probados por su empresa no alcanzan el mismo nivel en generación de video. Según explicó, las herramientas chinas ofrecen mejores resultados en seguimiento de instrucciones, estabilidad visual y sincronización de audio.

Director AI utiliza principalmente Kling para producir contenido generado por IA, incluyendo caricaturas y dramas cortos, aunque también alterna entre Seedance 2.0 y Hailuo —modelo desarrollado por la startup MiniMax— dependiendo de costos y necesidades específicas de producción.

Chiang sostuvo además que los controles de contenido más estrictos implementados por compañías estadounidenses suelen limitar la calidad y flexibilidad de los resultados. Según indicó, herramientas occidentales frecuentemente rechazan solicitudes por supuestas violaciones de políticas de uso sin entregar explicaciones detalladas.

George Won, cineasta y editor independiente especializado en IA, describió Seedance 2.0 como un “cambio total” para su libertad creativa. El creador aseguró que el modelo mantiene estabilidad visual incluso con ángulos agresivos de cámara y movimientos rápidos, escenarios donde muchas otras herramientas presentan deformaciones o inconsistencias.

Rankings independientes también parecen respaldar esta percepción. Kling, Seedance 2.0 y HappyHorse 1.0 obtuvieron posiciones destacadas en Arena, una plataforma de evaluación basada en votos de usuarios reales y considerada por algunos expertos más confiable que benchmarks tradicionales optimizados por los propios laboratorios de IA.

TikTok y los datos de video como ventaja estratégica

El núcleo de esta ventaja competitiva estaría en el acceso a datos. ByteDance y Kuaishou operan algunas de las plataformas de video corto más grandes del mundo, lo que les proporciona enormes volúmenes de material audiovisual para entrenamiento de modelos. TikTok, propiedad de ByteDance, es uno de los ejemplos más relevantes de este ecosistema.

A diferencia del texto, el contenido de video resulta mucho más complejo de recolectar masivamente mediante scraping abierto. Por ello, las compañías que poseen plataformas propias con grandes flujos de contenido generado por usuarios cuentan con una ventaja difícil de replicar.

Google también aparece como uno de los actores competitivos gracias a Veo 3, modelo que, según expertos citados, se beneficia del acceso a los enormes archivos audiovisuales de YouTube. Sin embargo, el reporte indica que sus sistemas incorporan más salvaguardas y limitaciones para desarrolladores.

El avance de los modelos chinos no está exento de controversias. ByteDance ha enfrentado amenazas legales relacionadas con presuntas violaciones de copyright, incluyendo la generación de videos utilizando personajes de franquicias como Marvel y South Park sin autorización correspondiente. La empresa aseguró que reforzará sus mecanismos de protección.

Mientras tanto, Kuaishou anunció esta semana que evalúa separar el negocio de Kling e incluso estudiar una posible salida bursátil independiente para capitalizar el rápido crecimiento de su división de video con IA.

Publicidad y ecommerce comienzan a transformarse

Más allá de la competencia tecnológica, el salto de calidad en generación de video comienza a abrir oportunidades comerciales concretas.

Vincent Yang, CEO de Firework —empresa enfocada en infraestructura de video para ecommerce— aseguró que la tecnología finalmente alcanzó un punto donde los videos generados por IA pueden cumplir estándares de marca y calidad profesional.

Antes, los videos eran incómodos y robóticos”, afirmó Yang. “Ahora estamos llegando al punto donde no puedes distinguir si fueron hechos por IA o por humanos”.

Según explicó, la automatización ya está transformando el sector publicitario al permitir producir cantidades masivas de contenido audiovisual a costos mucho menores.

Como ejemplo, Yang relató el caso de un minorista que solicitó la creación de 100.000 videos distintos para páginas de productos, algo que habría resultado prohibitivamente costoso sin herramientas de IA generativa.

La producción de video mediante IA, no obstante, sigue siendo extremadamente costosa en términos computacionales. El Financial Times señala que generar video requiere muchos más tokens —las unidades de procesamiento utilizadas por modelos de IA— que texto o audio. Esa presión de infraestructura habría influido en la decisión de OpenAI de discontinuar Sora en marzo debido a costos elevados de cómputo.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público

Este artículo fue escrito por un redactor de contenido de IA


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín