Por Canuto  

Las nuevas herramientas de programación con IA están ayudando a los ingenieros a producir más código y más cambios propuestos, pero varios análisis corporativos sugieren que una parte importante de ese volumen no se sostiene. El resultado sería una productividad más costosa y menos sólida de lo que aparentan métricas como el consumo de tokens o la aceptación inicial del código.
***

  • Firmas de analítica aseguran que el código generado con IA se acepta con rapidez, pero luego es reescrito o eliminado con mucha más frecuencia.
  • Waydev, GitClear, Faros AI y Jellyfish reportan aumentos fuertes en churn, costos de tokens y deuda técnica en equipos con alta adopción de IA.
  • Los ingenieros junior aparecerían como los más vulnerables a aceptar demasiado código de IA y enfrentar más retrabajo semanas después.

 


En la industria del software, medir productividad nunca ha sido sencillo. Durante años, las líneas de código sirvieron como una referencia imperfecta, pero el ascenso de agentes de programación con inteligencia artificial cambió otra vez la discusión.

Ahora, una nueva señal de estatus parece dominar algunas conversaciones en Silicon Valley: el tamaño del presupuesto de tokens que un desarrollador puede consumir. Es decir, cuánta capacidad de cómputo de IA tiene autorizada para usar mientras programa.

El problema, según varios actores del sector, es que esa métrica se enfoca en una entrada del proceso y no en el resultado real. Gastar más tokens puede reflejar mayor adopción de IA, pero no necesariamente mayor eficiencia ni mejor software.

Un reportaje de TechCrunch expone que varias empresas dedicadas a la analítica de productividad para desarrolladores están encontrando el mismo patrón. Los equipos escriben más código con ayuda de herramientas como Claude Code, Cursor y Codex, pero también regresan con más frecuencia a corregir, reescribir o eliminar ese mismo código.

Más aceptación inicial, pero mucha menos permanencia

Alex Circei, CEO y fundador de Waydev, explicó que muchos gerentes de ingeniería observan tasas de aceptación de código de entre 80% y 90%. Esa cifra representa la proporción de código generado por IA que los desarrolladores aprueban y mantienen en una primera instancia.

Sin embargo, Circei sostiene que esa lectura es incompleta. Según su análisis, muchos equipos no están captando la rotación posterior que ocurre durante las semanas siguientes, cuando los ingenieros deben volver sobre ese trabajo para revisarlo.

Al incorporar ese retrabajo, la tasa de aceptación en el mundo real caería a un rango de entre 10% y 30% del código generado por IA. En otras palabras, una fracción importante del código que parecía útil al principio no termina perdurando en la base de software.

Waydev trabaja con 50 clientes que, en conjunto, emplean a más de 10.000 ingenieros de software. La empresa fue fundada en 2017 para ofrecer analítica de desarrolladores, pero en los últimos seis meses rehizo por completo su plataforma para adaptarse a la expansión de las herramientas de programación acelerada por IA.

Su nuevo enfoque consiste en rastrear metadatos producidos por agentes de IA. Con ello busca ofrecer a los gerentes de ingeniería información sobre calidad, costos y adopción, con el fin de entender mejor si el uso de estas herramientas está generando resultados reales.

El sector corporativo busca medir el ROI real de la IA para programar

La discusión no se limita a una sola startup. Aunque las empresas de analítica tienen incentivos para destacar problemas que sus productos pueden ayudar a resolver, los datos recopilados por varias firmas apuntan en una dirección parecida.

Las grandes organizaciones todavía estarían tratando de descubrir cómo utilizar agentes de programación de forma eficiente. El interés corporativo en este tema ya es visible en operaciones de alto perfil dentro del sector tecnológico.

El año pasado, Atlassian adquirió DX, otra startup de inteligencia para ingeniería, por USD $1.000 millones. El objetivo fue ayudar a sus clientes a entender el retorno sobre la inversión de los agentes de programación.

Ese movimiento sugiere que las empresas no solo quieren adoptar IA para escribir código más rápido. También necesitan comprobar si ese código resiste el paso del tiempo, reduce trabajo manual y mejora realmente el desempeño de sus equipos.

La preocupación es relevante porque una aceleración superficial puede esconder costos posteriores. Si la mayor parte del valor prometido se diluye en revisiones, bugs, deuda técnica o reescrituras, la productividad observada al inicio puede ser engañosa.

Los datos de GitClear, Faros AI y Jellyfish refuerzan la alerta

Los hallazgos citados por TechCrunch muestran una narrativa consistente. Se está escribiendo más código, pero una parte desproporcionada de ese volumen no sobrevive.

GitClear publicó en enero un informe que concluyó que las herramientas de IA sí elevaban la productividad. No obstante, también detectó que sus datos mostraban que los usuarios regulares de IA promediaban una rotación de código 9,4 veces mayor que sus pares que no usaban estas herramientas.

Ese nivel de churn sería más del doble de las ganancias de productividad atribuidas a la IA. La lectura implícita es que producir más rápido no necesariamente compensa el volumen adicional de trabajo correctivo.

Faros AI llegó a una conclusión similar en su informe de marzo de 2026, elaborado con dos años de datos de clientes. Allí encontró que la rotación de código, medida como líneas eliminadas frente a líneas añadidas, había aumentado un 861% bajo una alta adopción de IA.

Jellyfish, por su parte, recopiló información sobre 7.548 ingenieros durante el primer trimestre de 2026. La firma observó que los ingenieros con los mayores presupuestos de tokens generaban la mayor cantidad de pull requests, pero la mejora de productividad no escalaba en la misma proporción.

Según ese análisis, esos desarrolladores obtenían el doble de rendimiento a un costo diez veces mayor en tokens. La conclusión resumida por la firma fue directa: las herramientas estaban produciendo volumen, no valor.

El costo oculto sería mayor para perfiles junior

Estas métricas coinciden con una percepción que ya circula entre programadores. Muchos desarrolladores reconocen que las nuevas herramientas ofrecen libertad y velocidad, pero también estarían elevando la carga de revisión de código y el peso de la deuda técnica.

Uno de los patrones más repetidos en estos análisis es la diferencia entre ingenieros senior y junior. Los perfiles más jóvenes tenderían a aceptar más código generado por IA, y eso terminaría exponiéndolos a mayores necesidades de reescritura después.

El fenómeno tiene implicaciones para la formación de talento. Si un desarrollador se acostumbra a validar grandes bloques de código sin comprenderlos por completo, el costo puede aparecer semanas más tarde, cuando ese trabajo deba ser auditado, corregido o eliminado.

Para las empresas, esto plantea un reto de gobernanza. No basta con habilitar presupuestos más grandes de tokens o promover el uso intensivo de agentes de código si no existen métricas de calidad, permanencia y costo por resultado.

También obliga a revisar cómo se evalúa a los equipos. Medir cantidad de pull requests, líneas aceptadas o consumo de IA puede ser útil como señal operativa, pero difícilmente sirve por sí solo como prueba de eficiencia.

La adopción no se detiene, pero la medición cambia

Pese a estas advertencias, nadie en el sector parece esperar un retroceso importante en la adopción de IA para desarrollar software. La discusión ya no gira en torno a si estas herramientas van a usarse, sino a cómo deben integrarse para que no generen una ilusión de productividad.

Circei resumió esa visión con una frase contundente: “Esta es una nueva era del desarrollo de software, y tienes que adaptarte, y estás obligado a adaptarte como empresa”. También agregó que no se trata de “un ciclo que vaya a pasar”.

Ese diagnóstico ayuda a entender por qué están surgiendo tantas plataformas de observabilidad y analítica alrededor del código asistido por IA. En un mercado donde los agentes prometen velocidad casi ilimitada, el recurso más escaso pasa a ser la capacidad de distinguir entre producción útil y ruido costoso.

Para directivos, inversionistas y líderes técnicos, la lección parece clara. Un mayor gasto en tokens y una mayor cantidad de código pueden lucir impresionantes en un tablero, pero no bastan para demostrar productividad si el software debe reescribirse poco después.

En esa tensión entre volumen y permanencia se está definiendo una de las preguntas centrales de la era del código generado por IA. No cuánto puede producir una máquina, sino cuánto de ese resultado merece quedarse.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín