Amazon retiró una clasificación interna que premiaba el uso de IA después de que empleados inflaran sus puntajes con tareas sin valor, elevando costos de nube y reabriendo el debate sobre cómo medir la productividad real de la inteligencia artificial en las empresas.
***
- Amazon cerró Kirorank, un panel interno que medía la actividad de empleados en la plataforma para desarrolladores Kiro.
- Algunos trabajadores usaron agentes de IA para tareas inútiles con el fin de subir en la clasificación, lo que generó costos adicionales de nube.
- La compañía ahora busca medir despliegues normalizados, es decir, código generado por IA que realmente resulte útil.
Amazon está retirando Kirorank, una clasificación interna vinculada al uso de inteligencia artificial por parte de sus desarrolladores, luego de que empleados la manipularan con tareas sin sentido. El episodio muestra una tensión creciente dentro de las grandes tecnológicas: impulsar la adopción de IA sin convertir las métricas de uso en un juego costoso.
Según informó The Decoder citando un reporte de Financial Times, el panel medía la actividad de empleados en Kiro, la plataforma para desarrolladores de Amazon. El objetivo era fomentar el uso de herramientas de IA en el trabajo diario, pero algunos trabajadores encontraron una forma simple de escalar posiciones: pedir a agentes de IA que ejecutaran acciones inútiles.
El resultado no fue solo una distorsión estadística. La práctica también elevó los costos de nube de la propia compañía, un detalle particularmente sensible para una empresa que opera uno de los mayores negocios de infraestructura tecnológica del mundo.
Una métrica diseñada para incentivar terminó premiando el ruido
Kirorank nació como un tablero interno para mostrar qué empleados usaban con más intensidad Kiro. En teoría, ese tipo de clasificación puede servir para acelerar el cambio cultural dentro de una organización grande, especialmente cuando una empresa quiere que sus equipos adopten nuevas herramientas de IA.
El problema apareció cuando la métrica empezó a medir actividad bruta, no valor. Si el sistema premiaba el uso, algunos empleados podían aumentar sus puntajes sin generar mejoras reales en el código, el producto o la productividad. Esa brecha entre incentivo y resultado abrió la puerta al abuso.
De acuerdo con la información citada, empleados instruyeron a agentes de IA para realizar tareas inútiles. El objetivo era subir en la tabla, no resolver problemas técnicos relevantes. La conducta expuso una debilidad habitual en los sistemas de medición corporativa: cuando una cifra se convierte en objetivo, puede dejar de reflejar el desempeño que buscaba representar.
Dave Treadwell, vicepresidente sénior de Amazon, habría advertido al personal sobre esa dinámica. “Por favor, no usen la IA solo por usar la IA“, dijo presuntamente la empresa a los empleados. También señaló que el panel se creó con buenas intenciones, pero terminó generando costos adicionales.
El costo de usar IA sin propósito
El caso resulta relevante porque la IA generativa no es gratis de operar. Cada consulta, ejecución de agente o ciclo de generación puede consumir recursos computacionales. En una compañía del tamaño de Amazon, incluso pequeños incentivos mal diseñados pueden traducirse en un volumen considerable de uso innecesario.
El reporte indica que la manipulación de Kirorank elevó costos de nube dentro de la empresa. No se detalló una cifra específica para ese gasto adicional, por lo que el impacto financiero exacto no fue informado. Aun así, el incidente llega en un momento de fuerte inversión en infraestructura.
Amazon planea gastar alrededor de USD $200.000 millones en 2026, principalmente en infraestructura de inteligencia artificial. Esa cifra ilustra la escala de la apuesta tecnológica de la compañía. También explica por qué sus directivos prestan atención a cómo se utilizan las herramientas internas.
La compañía se fijó además una meta ambiciosa: lograr que más del 80% de sus desarrolladores usen IA semanalmente. Ese objetivo puede acelerar la incorporación de asistentes de programación, agentes y sistemas de automatización. Pero Kirorank muestra que una meta de adopción necesita controles claros para distinguir uso productivo de consumo artificial.
Amazon no es el único caso
El patrón no apareció solo en Amazon. La misma dinámica se observó en Meta, donde empleados también persiguieron puntuaciones similares de uso de IA. El dato sugiere que el desafío va más allá de una herramienta o de una empresa específica.
Las grandes tecnológicas compiten por demostrar que sus plantillas adoptan la IA a gran velocidad. Esa presión puede venir de directivos, inversionistas y del propio mercado laboral. En ese contexto, los paneles internos pueden convertirse en símbolos de modernización, pero también en incentivos peligrosos.
Para lectores que siguen el sector de inteligencia artificial, el caso recuerda debates ya conocidos en mercados financieros y cripto. Medir solo volumen de operaciones, transacciones o actividad puede crear una imagen distorsionada de adopción. La cifra crece, pero el valor económico no necesariamente acompaña.
Algo parecido ocurre con el uso de tokens en sistemas de IA. Un alto consumo puede indicar trabajo intenso, pero también puede reflejar prompts redundantes, automatizaciones mal diseñadas o agentes ejecutando tareas irrelevantes. Por eso, muchas empresas empiezan a buscar métricas más cercanas al resultado final.
De tokens consumidos a despliegues útiles
Amazon ahora dejará de enfocarse en el consumo bruto asociado al uso de IA y pasará a rastrear despliegues normalizados. Ese concepto apunta a código generado por IA que realmente resulte útil. La diferencia es importante, porque desplazar la medición hacia resultados reduce el incentivo a producir actividad vacía.
Un despliegue normalizado busca capturar valor práctico. En lugar de premiar cuántas veces un empleado activó un agente, la empresa intenta observar si el código asistido por IA llegó a integrarse de forma útil. Esa métrica se acerca más al impacto en ingeniería y menos al conteo superficial de interacciones.
El cambio también refleja una maduración del discurso empresarial sobre IA. Durante la primera fase de adopción, muchas compañías se concentraron en lograr que sus equipos probaran las herramientas. En una etapa posterior, el reto pasa a ser demostrar productividad, calidad y ahorro real.
Para Amazon, esa distinción tiene peso estratégico. La empresa promueve el uso interno de IA mientras invierte grandes sumas en infraestructura. Si sus propios sistemas de medición generan desperdicio, la señal interna puede volverse contradictoria. Por eso, el cierre de Kirorank funciona como corrección operativa y como mensaje cultural.
Una lección para la adopción empresarial de IA
El episodio deja una advertencia para cualquier empresa que quiera imponer metas de inteligencia artificial. No basta con medir cuántas personas usan una herramienta. También importa saber qué problema resuelven, qué costos generan y si el resultado mejora procesos reales.
Las clasificaciones internas pueden motivar a los equipos, pero también pueden provocar comportamientos defensivos o competitivos. Si el premio depende de una métrica simple, los empleados pueden optimizar para esa métrica. Eso no implica necesariamente mala fe, sino una respuesta previsible a incentivos mal calibrados.
En el caso de Amazon, la frase atribuida a Treadwell resume el centro del debate: no usar IA solo por usar IA. La tecnología puede aumentar productividad, reducir fricción en programación y acelerar tareas repetitivas. Pero su valor depende de un diseño organizacional que premie resultados verificables.
Kirorank se convirtió así en un ejemplo temprano de los riesgos de la IA corporativa cuando la adopción se mide por actividad y no por utilidad. Para las empresas que invierten en agentes, copilotos y plataformas internas, la lección es directa: el entusiasmo necesita métricas más inteligentes que el simple conteo de uso.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
IA
En una simulación de sociedad IA, Claude mantuvo el orden pero Grok destruyó el mundo
Empresas
Dan Ives cree que Anthropic puede crecer a más de USD $1 billón: la ola de IA apenas empieza
Empresas
SpaceX recorta su meta de valoración para la IPO a USD $1,8 billones
Empresas