Por Canuto  

El auge de la inteligencia artificial podría entrar en una nueva etapa: no necesariamente ganará el modelo más potente, sino el que resuelva más tareas al menor costo. La creciente presión sobre los presupuestos empresariales ya está empujando a algunas compañías a probar sistemas más pequeños, un movimiento que podría alterar los ingresos de los grandes laboratorios de IA justo cuando se acercan a momentos financieros clave.
***

  • Brian Armstrong estima que el 80% de las cargas de trabajo podrían migrar a modelos 99% más baratos en 12 a 18 meses.
  • Harvey aseguró haber reducido sus costos de inferencia en 3x sin afectar la calidad, mediante una combinación de modelos.
  • Si la tendencia se consolida, OpenAI y Anthropic podrían enfrentar presión sobre sus ingresos y sobre la lógica económica de entrenar modelos de frontera.

 


La industria de la inteligencia artificial se construyó sobre una idea dominante: cuanto más grande y potente es un modelo, mayor será su ventaja competitiva. Sin embargo, esa premisa empieza a mostrar grietas a medida que las empresas enfrentan facturas más altas por inferencia y menos margen para sostener experimentos costosos.

Ese cambio está abriendo espacio para una nueva pregunta dentro del mercado: si muchas tareas pueden resolverse con modelos más pequeños y mucho más baratos, ¿seguirán las compañías pagando una prima por usar siempre la opción más avanzada?

La discusión no es menor. Si se confirma una migración importante hacia modelos de menor costo, la economía de la IA podría cambiar de forma profunda, afectando tanto a startups especializadas como a grandes laboratorios que hoy dominan la conversación tecnológica.

Según reportó TechCrunch, una de las proyecciones más citadas en este debate provino del cofundador de Coinbase, Brian Armstrong. El empresario planteó que la demanda de inteligencia es casi infinita, pero consideró que el 80% de las cargas de trabajo funcionarán en modelos 99% más baratos dentro de 12 a 18 meses, mientras el 20% restante seguirá recurriendo a sistemas de frontera para casos en los que maximizar el rendimiento sea crítico.

La presión de costos cambia las prioridades

Hasta hace poco, el incentivo del mercado apuntaba en una sola dirección. Las empresas de IA competían principalmente en calidad, y eso empujaba a los clientes a adoptar el modelo más avanzado disponible, incluso cuando el costo operativo podía ser elevado.

Esa lógica resultaba más fácil de sostener en un contexto de subsidios fuertes por parte de inversionistas. Mientras los precios se mantenían artificialmente bajos, muchos clientes no tenían una razón clara para apartarse de la frontera tecnológica y probar alternativas más modestas.

Ahora el panorama es distinto. Con el aumento del precio de los tokens y una reducción de los subsidios, los usuarios empresariales están sintiendo por primera vez una presión real sobre sus costos, lo que los obliga a revisar con más cuidado cuánto valor reciben por cada llamada a un modelo.

En ese entorno, la noción de calidad también empieza a redefinirse. Ya no se trata solo de usar el sistema más potente para cualquier tarea, sino de elegir el modelo que entregue una respuesta correcta con la mayor eficiencia posible.

Si esta visión termina imponiéndose, buena parte del dinero que hoy llega a los grandes laboratorios podría desviarse hacia opciones más económicas. Eso tendría implicaciones directas para compañías como OpenAI y Anthropic, especialmente en un momento en que ambas se encaminan hacia procesos de oferta pública inicial.

El caso Harvey y la idea de enrutar tareas

Las primeras pruebas sugieren que el reemplazo parcial de modelos grandes por otros más baratos no necesariamente implica una caída de calidad. Uno de los ejemplos citados en el reporte fue el de Harvey, la herramienta legal de IA, que realizó una prueba reciente en asociación con la plataforma de inferencia Fireworks AI.

Según esa experiencia, Harvey logró reducir sus costos de inferencia en 3x sin deteriorar la calidad del resultado. El sistema combinó Claude Opus con GLM 5.1 de Fireworks, y reservó Opus para las tareas más intensivas, una arquitectura que redujo de forma notable la carga sobre servidores y el costo total.

Gabe Pereyra, cofundador de Harvey, explicó que la calidad sigue siendo la prioridad, especialmente en el ámbito legal. No obstante, añadió que la definición de calidad está evolucionando desde la idea de usar el modelo más poderoso para todo, hacia la de usar el mejor modelo capaz de dar la respuesta correcta de la forma más eficiente.

Ese matiz es importante porque muestra que el debate no gira solo en torno al rendimiento bruto. También involucra diseño de sistemas, clasificación de tareas y una mejor administración de recursos de cómputo en contextos donde cada consulta empieza a pesar más en la estructura de costos.

Para lectores nuevos en el tema, la inferencia es el proceso mediante el cual un modelo ya entrenado responde preguntas, genera texto o ejecuta una tarea. En muchos negocios de IA, el gasto cotidiano no se concentra únicamente en entrenar el sistema, sino en sostener millones de solicitudes de uso en producción.

La división clave no sería abierta contra propietaria

Con frecuencia, esta discusión se presenta como una disputa entre grandes laboratorios occidentales y modelos chinos o de peso abierto. Sin embargo, ese encuadre puede ocultar la dimensión más relevante del cambio que está ocurriendo.

La separación decisiva, según el análisis, no estaría entre software propietario y abierto, sino entre modelos grandes y modelos pequeños. Es decir, la sustitución de una opción cara por otra más económica puede ocurrir tanto dentro del ecosistema de laboratorios cerrados como fuera de él.

El reporte pone un ejemplo concreto: cambiar de GPT-5.5 a V4 Flash de DeepSeek puede reducir costos, pero hacer el salto a GPT-5.4-mini puede ofrecer un beneficio similar. En otras palabras, para el problema mayor de pequeño frente a grande, importa menos quién gane esa competencia y más que la empresa encuentre un sistema suficiente a un costo menor.

Esto también sugiere que la guerra de precios ya no se limita a una rivalidad ideológica entre modelos de código abierto y plataformas cerradas. Lo que está en juego es una disputa comercial entre inferencia interna de los grandes laboratorios y modelos más ligeros servidos por terceros o por variantes más compactas del mismo proveedor.

Para muchas compañías, el criterio práctico puede terminar pesando más que la lealtad tecnológica. Si una tarea común se resuelve con precisión aceptable usando menos cómputo, el incentivo financiero para mantener siempre el modelo más costoso podría debilitarse con rapidez.

Lo que podría cambiar para el negocio de la IA

El posible impacto de este giro sería considerable. Si la predicción de Armstrong se cumple y la mayor parte de las tareas termina migrando a modelos más baratos, la demanda de inferencia de alto costo podría desacelerarse de forma seria.

Eso abriría nuevas dudas sobre la viabilidad económica de entrenar modelos de frontera, un proceso que requiere inversiones enormes en hardware, energía, talento y tiempo. El supuesto que justificaba ese gasto era que el mercado premiaría siempre al modelo más capaz.

Pero si los clientes descubren que una parte sustancial de sus despliegues puede operar igual de bien con alternativas más pequeñas, la rentabilidad esperada de los sistemas más avanzados quedaría bajo mayor presión. En ese escenario, el mercado no dejaría de valorar la frontera, pero sí podría reservarla para un conjunto más limitado de usos.

Eso no significa que la transición ya esté definida. El propio análisis reconoce que las empresas podrían responder a la presión de costos de otras maneras, como hacer menos llamadas, usar menos contexto o abandonar implementaciones menos prometedoras en vez de migrar a modelos pequeños.

Sin embargo, el solo hecho de que esta discusión gane tracción revela una maduración del mercado. La era en la que bastaba con elegir el modelo más impresionante podría estar dando paso a otra en la que eficiencia, enrutamiento inteligente y retorno sobre la inversión pesen tanto como el rendimiento máximo.

Para los grandes laboratorios, esa sería una señal incómoda. Para las empresas usuarias, en cambio, podría representar una oportunidad para ampliar despliegues de IA sin disparar sus presupuestos. La batalla por el futuro del sector ya no se libraría solo en quién tiene el modelo más poderoso, sino en quién ofrece el equilibrio más convincente entre costo y calidad.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín