Empresas grandes y startups están reduciendo sus costos de inteligencia artificial mediante modelos más baratos, incluidos sistemas de código abierto y modelos desarrollados en China, una tendencia que presiona a OpenAI y Anthropic a bajar precios mientras intentan acercarse a la rentabilidad.
***
- Compañías están combinando modelos de IA para evitar depender siempre de opciones premium como ChatGPT y Claude.
- Herramientas de enrutamiento permiten reducir costos de ciertos trabajos asistidos por IA hasta en 95%, según ejecutivos citados por WSJ.
- OpenAI estaría evaluando fuertes recortes de precios ante expectativas de medidas similares por parte de Anthropic.
- Modelos como DeepSeek, Qwen, Kimi y Nemotron ganan terreno frente a alternativas propietarias más costosas.
🚨 La guerra de precios en IA ha comenzado 🚨
Grandes empresas y startups están migrando a modelos más económicos, incluyendo opciones chinas y de código abierto.
Esto presiona a OpenAI y Anthropic a bajar sus tarifas premium.
Se estima que algunas empresas pueden reducir… pic.twitter.com/3smScaem7M
— Diario฿itcoin (@DiarioBitcoin) June 12, 2026
La guerra de precios en inteligencia artificial (IA) ya comenzó. Empresas grandes y startups están buscando formas de reducir el gasto creciente en IA mediante herramientas que combinan diferentes modelos según costo, rendimiento y dificultad de cada tarea.
La tendencia, reseñada por The Wall Street Journal, aumenta la presión sobre OpenAI y Anthropic, dos de los principales proveedores de modelos de frontera, cuyas tarifas premium enfrentan ahora más competencia de modelos abiertos, modelos pequeños y alternativas desarrolladas en China.
El cambio responde a un problema práctico. A medida que las compañías integran IA en flujos de trabajo reales, los costos de inferencia, tokens, agentes autónomos y herramientas de productividad pueden crecer con rapidez. En lugar de enviar todas las tareas a los modelos más potentes de OpenAI, Anthropic o Google, muchas empresas están empezando a enrutar consultas hacia modelos más baratos cuando la tarea no requiere capacidades de frontera. Los modelos premium quedan reservados para instrucciones complejas, razonamiento avanzado, programación más difícil o casos donde la precisión justifica el gasto.
Según ejecutivos citados por WSJ, esta arquitectura puede reducir el costo de ciertos trabajos asistidos por IA hasta en 95%. La idea es simple: no usar un modelo caro para tareas que un modelo más pequeño, abierto o especializado puede resolver suficientemente bien. Para empresas que procesan millones de tokens diarios, esa diferencia puede representar millones de dólares en ahorro anual.
Empresas mezclan modelos para bajar costos
La nueva estrategia se basa en herramientas que seleccionan dinámicamente entre modelos de terceros, sistemas internos y modelos construidos sobre alternativas de código abierto. Los agentes de IA pueden usar opciones baratas para tareas rutinarias y escalar temporalmente a modelos más sofisticados cuando encuentran un problema difícil. En la práctica, esto convierte la infraestructura de IA en una cartera de modelos, no en una relación exclusiva con un solo proveedor.
Dan Robinson, fundador de Detail, una startup que identifica errores de software, dijo a WSJ que una vez que su equipo encuentra algo que funciona bien para los ingenieros, busca formas de hacerlo rentable. La compañía trasladó 90% de su carga de trabajo desde Claude y Gemini hacia modelos personalizados y GLM, una familia de modelos desarrollada en China.
El caso muestra cómo la competencia ya no viene solo de grandes laboratorios estadounidenses. Modelos de compañías como Alibaba, DeepSeek, Moonshot AI y Xiaomi están siendo considerados por empresas que priorizan costo, rendimiento específico y disponibilidad. También aparecen alternativas impulsadas por Nvidia, Microsoft y startups enfocadas en modelos abiertos o más eficientes.
El fenómeno no significa que los modelos de frontera hayan perdido valor. Investigadores citados por WSJ señalaron que las mejores opciones propietarias de OpenAI, Anthropic o Google todavía estarían entre cuatro y seis meses por delante de competidores abiertos en determinadas capacidades. Pero en muchas tareas corporativas, esa ventaja no siempre compensa el costo. La pregunta deja de ser cuál modelo es “mejor” en abstracto y pasa a ser cuál entrega el menor costo por tarea completada.
OpenAI y Anthropic bajo presión
La presión sobre precios llega en un momento delicado para OpenAI y Anthropic. Ambas empresas gastan miles de millones de dólares al año en capacidad de cómputo para entrenar y operar modelos avanzados. Si los clientes migran una parte creciente de sus tareas hacia opciones más baratas, el margen de esas compañías podría comprimirse justo cuando buscan demostrar que pueden convertirse en negocios rentables.
WSJ reportó que OpenAI está considerando recortes drásticos en los precios que cobra a usuarios de IA, anticipando medidas similares por parte de Anthropic. La empresa de Sam Altman cree tener una ventaja en ese escenario porque habría asegurado acceso a recursos de cómputo a costos más bajos que los precios disponibles actualmente en el mercado.
Sin embargo, la propia OpenAI reconoce que el costo se volvió un problema central: Altman dijo recientemente en un evento interno que los costos se habían convertido de repente en “un enorme problema”.
La competencia por precios también puede profundizar las pérdidas de OpenAI y Anthropic. Estos laboratorios necesitan mantener inversiones masivas en chips, centros de datos, investigación y talento para preservar su ventaja técnica. Pero si el mercado empuja los precios hacia abajo, la monetización de esa ventaja se vuelve más difícil.
El debate de fondo es si los modelos de IA serán comoditizados con el tiempo o si los líderes podrán sostener primas significativas gracias a mejoras continuas. Vishal Misra, vicedecano de computación e IA en la escuela de ingeniería de Columbia University, resumió el problema de forma directa: no todas las tareas necesitan un modelo capaz de resolver problemas de máxima complejidad. Para muchas empresas, modelos abiertos suficientemente buenos pueden erosionar la capacidad de cobrar una prima elevada.
Modelos chinos y código abierto ganan adopción
Uno de los elementos más relevantes del informe es el crecimiento de modelos chinos y de código abierto dentro de empresas estadounidenses. DeepSeek, por ejemplo, aumentó su participación de uso en la plataforma de Vercel de 1% en abril a 17% en mayo, según datos de la compañía citados por WSJ. En OpenRouter, una startup que procesa consultas de IA, DeepSeek se convirtió en la compañía de IA más utilizada desde mediados de mayo.
OpenRouter también informó que entre sus clientes de mayor gasto, el uso de tokens de modelos abiertos creció cuatro veces más rápido que el de modelos cerrados entre el otoño de 2025 y la primavera de 2026. La firma habría visto además a más de 500 organizaciones migrar desde modelos propietarios hacia alternativas de código abierto.
La razón principal es económica. Los modelos abiertos suelen costar mucho menos por token, la unidad básica de cómputo usada para medir entradas y salidas en sistemas de IA. WSJ citó como ejemplo que Fable 5, el modelo reciente de Anthropic, es más de 50 veces más caro por token que DeepSeek V4 Pro. Esa diferencia obliga a las empresas a revisar con más cuidado qué modelo utilizan para cada tarea.
Sin embargo, el cálculo no siempre es tan simple como comparar precio por token. Anthropic argumenta que las compañías evalúan cada vez más el precio por tarea, es decir, cuánto cuesta completar una tarea de principio a fin. Un modelo más caro por token puede terminar siendo competitivo si resuelve una tarea compleja con menos intentos, menos pasos o menos tokens totales. Esa es la defensa central de los proveedores premium: no se trata solo de costo unitario, sino de productividad final.
Empresas buscan eficiencia por tarea
La startup Lindy, enfocada en asistentes ejecutivos de IA, comenzó a explorar DeepSeek V4 hace dos meses, según su fundador Flo Crivello. La empresa probó si el modelo chino podía gestionar tareas como organizar bandejas de entrada y calendarios, redactar correos y transcribir reuniones. El resultado fue que DeepSeek manejó esas tareas tan bien como Sonnet de Anthropic, con una ventaja particular en clasificación de correos, y a un costo 10 veces menor, según Crivello.
Lindy sigue usando un modelo más avanzado de Anthropic para programación interna, pero el cambio general le habría ahorrado millones de dólares. Ese enfoque híbrido es precisamente lo que empieza a dominar: modelos baratos para tareas repetitivas o bien definidas, modelos de frontera para casos donde el error es más costoso o el razonamiento requerido es mayor.
Otras empresas están construyendo sus propios modelos internos a partir de alternativas abiertas y entrenándolos con datos corporativos. En algunos casos, ejecutivos sostienen que esos modelos especializados pueden igualar o superar a modelos de frontera en tareas concretas de la compañía. Esto refuerza una tesis importante: la ventaja de un modelo generalista puede reducirse cuando una empresa tiene datos propios, objetivos claros y tareas repetibles.
Andrew Moore, exjefe de IA de Google Cloud y fundador de Lovelace AI, describió esta tendencia como una nueva disciplina de parsimonia en los agentes. Sus sistemas buscan obtener resultados con el modelo más barato posible y solo escalan a opciones más caras cuando se complican. Esa lógica se parece al enrutamiento eficiente de recursos en la nube: usar capacidad premium únicamente cuando aporta valor marginal claro.
Microsoft, Nvidia y nuevas opciones más baratas
La presión no viene solo desde China o desde comunidades de código abierto. Grandes tecnológicas estadounidenses también están impulsando modelos más pequeños y eficientes. Microsoft presentó recientemente una suite de modelos menores que, según la compañía, pueden operar con más eficiencia que los modelos de frontera. Nvidia, por su parte, lanzó Nemotron, una familia de modelos más baratos que está ganando tracción, y también respaldó a Reflection, una startup que desarrolla IA de código abierto.
Este movimiento sugiere que la industria está entrando en una etapa más madura. El primer ciclo de IA generativa estuvo dominado por la carrera hacia modelos cada vez más grandes y potentes. El nuevo ciclo parece orientado a eficiencia, especialización, costos operativos y retorno sobre inversión. Las empresas ya no preguntan solo qué modelo ofrece la demostración más impresionante, sino cuál permite automatizar tareas reales sin destruir el presupuesto.
Citadel Securities también observó señales de este cambio. Según WSJ, la firma señaló en un reporte que la migración hacia modelos más baratos pudo haber contribuido a una reciente caída en un índice seguido por el mercado que rastrea gasto en IA. La lectura de Citadel es que incluso las tecnologías más poderosas deben pasar por la disciplina de curvas de costos, restricciones de capacidad y retornos marginales.
Ese punto conecta con una preocupación más amplia en Wall Street. Durante los últimos años, la narrativa de IA sostuvo enormes inversiones en infraestructura, chips, centros de datos y compañías privadas. Pero si los clientes empresariales se vuelven más sensibles al precio y migran hacia modelos más baratos, los supuestos de ingresos futuros para los líderes del sector podrían enfrentar revisión.
Una guerra que puede beneficiar a usuarios, pero golpear márgenes
Para clientes empresariales, la guerra de precios puede ser positiva. Menores costos de inferencia facilitan experimentar, automatizar procesos y desplegar agentes de IA en más áreas. También reduce la dependencia de un solo proveedor y permite ajustar calidad y precio según necesidad. Esto puede acelerar la adopción de IA en sectores donde el gasto había empezado a volverse prohibitivo.
Para OpenAI y Anthropic, el panorama es más complejo. Ambas compañías pueden responder con modelos más baratos, descuentos y mejores herramientas de eficiencia. De hecho, ya ofrecen opciones de menor costo para ciertos casos de uso. Pero la presión competitiva puede limitar su capacidad de convertir liderazgo técnico en márgenes elevados, especialmente si los clientes usan modelos premium solo como capa superior para tareas difíciles.
El resultado probable es un mercado más segmentado. Los modelos de frontera seguirán siendo relevantes para razonamiento avanzado, programación compleja, investigación, agentes de alto valor y tareas donde la confiabilidad justifica pagar más. Pero buena parte del uso cotidiano podría desplazarse hacia modelos abiertos, modelos pequeños, sistemas internos y enrutadores que optimizan costo por tarea.
La industria de IA entra así en una etapa menos dominada por el asombro tecnológico y más guiada por economía operativa. La pregunta ya no es solo quién tiene el modelo más potente, sino quién puede entregar inteligencia útil al menor costo posible. Esa diferencia puede definir qué compañías capturan valor y cuáles terminan financiando infraestructura cara en un mercado cada vez más competitivo.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público
Este artículo fue escrito por un redactor de contenido de IA
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Estados Unidos
Anthropic propone plan ante desempleo por IA y promete financiar parte de la respuesta
Estados Unidos
Ley de vigilancia masiva de EE.UU. expirará por primera vez tras rechazo a nominado de Trump
Bitcoin
BlackRock avanza para estrenar su nuevo ETF Bitcoin la próxima semana en Nasdaq
Empresas