Anthropic puso a prueba un mercado de clasificados donde agentes de IA negociaron compras y ventas reales en nombre de personas. El piloto, aunque pequeño, dejó una señal potente: los usuarios representados por modelos más avanzados consiguieron mejores resultados, incluso sin notar la diferencia.
***
- Anthropic realizó un piloto llamado Project Deal con 69 empleados y un presupuesto de USD $100 para cada uno.
- Los agentes de IA cerraron 186 acuerdos por más de USD $4.000 en bienes reales y dinero real.
- La empresa observó que los modelos más avanzados lograron resultados objetivamente mejores, lo que plantea riesgos de brechas de calidad entre agentes.
🚨 Anthropic realiza un experimento pionero con agentes de IA que negocian transacciones reales.
Cerraron 186 acuerdos por más de USD $4,000.
Modelos avanzados demostraron mejores resultados en comparación con otros.
Se plantea una posible "brecha de calidad del agente" que… pic.twitter.com/GLgXGByeCg
— Diario฿itcoin (@DiarioBitcoin) April 26, 2026
Anthropic realizó un experimento poco común para medir cómo podría funcionar el comercio entre agentes de inteligencia artificial. La empresa creó un mercado de clasificados interno en el que sistemas de IA representaron tanto a compradores como a vendedores, y negociaron acuerdos reales por bienes reales y dinero real.
La prueba recibió el nombre de Project Deal y, aunque la propia empresa la describió como un experimento piloto con un grupo autoseleccionado, los resultados llamaron su atención. Según explicó la compañía, el sistema logró completar un volumen de transacciones que superó sus expectativas iniciales.
Para un público que sigue de cerca la evolución de la IA, el caso resulta relevante porque apunta a un futuro en el que agentes autónomos no solo responderán preguntas o automatizarán tareas, sino que también podrían actuar como intermediarios económicos. Esa posibilidad conecta con tendencias más amplias en automatización comercial, finanzas digitales y mercados algorítmicos.
De acuerdo con la información reportada por TechCrunch, participaron 69 empleados de Anthropic. Cada uno recibió un presupuesto de USD $100, pagado mediante tarjetas de regalo, para comprar artículos a sus compañeros de trabajo dentro del entorno de prueba.
En total, Project Deal cerró 186 acuerdos por un valor combinado superior a USD $4.000. Más allá de la cifra, el dato importante es que no se trató de una simulación abstracta. Los bienes y el dinero involucrados eran reales, y eso dio al experimento un nivel de fricción y compromiso más cercano al de un mercado funcional.
Anthropic señaló que quedó sorprendida por lo bien que operó el sistema. Esa reacción sugiere que, incluso en una etapa temprana y con una base limitada de participantes, los agentes ya pueden coordinar intercambios útiles entre personas con un grado de eficacia mayor al esperado.
Cómo funcionó Project Deal
La estructura del experimento incluyó cuatro mercados separados, cada uno diseñado para comparar comportamientos bajo distintas configuraciones de modelos. Uno de esos mercados fue considerado “real” por la empresa, en el sentido de que todos los participantes estuvieron representados por el modelo más avanzado de Anthropic y los acuerdos alcanzados se respetaron efectivamente después del piloto.
Los otros tres mercados se usaron con fines de estudio. Aunque la compañía no detalló en esta nota cada diferencia técnica entre esas variantes, sí dejó claro que buscaba observar cómo cambiaban los resultados dependiendo del tipo de agente asignado a cada usuario.
Ese diseño permitió comparar no solo la actividad de compraventa, sino también la calidad de los resultados obtenidos por los participantes. En otras palabras, Anthropic no se limitó a medir cuántas operaciones se cerraban, sino también si ciertos modelos negociaban mejor que otros.
El hallazgo más relevante fue que los usuarios representados por modelos más avanzados obtuvieron “resultados objetivamente mejores”, según la empresa. Esto introduce una discusión sensible: si el agente actúa como representante económico de una persona, la calidad del modelo podría convertirse en una ventaja competitiva concreta dentro del mercado.
En la práctica, eso implica que dos usuarios con intereses similares podrían terminar con resultados distintos solo por estar asistidos por agentes de diferente nivel. En un entorno comercial automatizado, esa disparidad podría parecer técnica, pero sus efectos serían económicos.
El punto adquiere mayor peso porque Anthropic observó que los usuarios no parecieron notar esa diferencia. Así, una parte de los participantes podría salir perjudicada sin percibir claramente que su representación algorítmica fue menos eficiente.
La brecha de calidad entre agentes
Ese fenómeno llevó a la empresa a plantear la posibilidad de futuras “brechas de calidad del agente”. La expresión describe un escenario en el que algunos usuarios reciben un servicio algorítmico superior, mientras otros quedan en desventaja sin una señal evidente de que están negociando en peores condiciones.
La idea recuerda debates ya conocidos en tecnología financiera y plataformas digitales, donde la asimetría de información suele favorecer a quienes tienen mejores herramientas. La diferencia aquí es que el desequilibrio no surgiría solo por acceso a datos o velocidad, sino por la capacidad estratégica del agente de IA que actúa en nombre del usuario.
En un mercado tradicional, una persona puede notar si un corredor, asesor o vendedor no está obteniendo buenos resultados. En cambio, cuando la negociación la ejecuta una inteligencia artificial, esa evaluación podría volverse mucho más opaca para el usuario promedio.
Esto abre preguntas de diseño y regulación sobre transparencia, auditoría y estándares mínimos para agentes comerciales. Si la automatización avanza hacia un modelo de comercio agente a agente, la confianza no dependerá únicamente de que el sistema funcione, sino de que las personas entiendan si están recibiendo una representación justa.
También podría emerger un mercado escalonado de agentes premium y agentes básicos, donde la calidad de la IA determine parte del resultado económico. Aunque Project Deal fue un piloto interno y pequeño, el experimento sirve como indicio temprano de esa dinámica.
Por ahora, Anthropic no presentó este ensayo como un producto comercial a gran escala. Sin embargo, sus resultados ayudan a visualizar un entorno en el que negociar precios, condiciones y disponibilidad de bienes podría ser una tarea cada vez más delegada a software autónomo.
Lo que no cambió en las negociaciones
Otro aspecto interesante del experimento fue que las instrucciones iniciales dadas a los agentes no parecieron influir en la probabilidad de venta ni en los precios negociados. Ese resultado sugiere que, al menos en este piloto, la capacidad general del modelo pesó más que las directrices de arranque.
Para quienes siguen el desarrollo de sistemas de IA, ese dato es útil porque indica que no siempre basta con ajustar prompts o reglas iniciales para obtener un mejor desempeño económico. La arquitectura y la potencia del modelo podrían tener un impacto más determinante que la orientación superficial que recibe antes de operar.
En términos prácticos, esto refuerza la tesis central del experimento. Si dos agentes parten con instrucciones similares, pero uno consigue mejores acuerdos, la diferencia parece residir más en la calidad del sistema que en la formulación de sus órdenes.
Ese punto podría tener implicaciones para empresas que planeen desplegar agentes de compra, venta o negociación. La ventaja competitiva no estaría solo en conectar la IA a un mercado, sino en contar con modelos capaces de interpretar contexto, ceder cuando conviene y maximizar valor para su representado.
Aun así, conviene mantener cautela. El propio ensayo se desarrolló con una muestra pequeña y autoseleccionada, dentro de una organización específica y con un presupuesto acotado. Eso limita cualquier conclusión general sobre cómo se comportarían estos sistemas en plataformas abiertas y a mayor escala.
Pese a esas limitaciones, el caso aporta una señal concreta de hacia dónde podría moverse la economía digital asistida por IA. Si hoy un grupo reducido de empleados ya puede completar transacciones reales a través de agentes, mañana ese mismo principio podría trasladarse a mercados más amplios, servicios digitales e incluso infraestructuras de comercio automatizado.
Lo más llamativo de Project Deal no es solo que los agentes hayan logrado vender y comprar artículos. Es que el experimento mostró, en condiciones reales, que la calidad del modelo puede traducirse en una ventaja económica medible, aun cuando el usuario no sea consciente de ello.
Esa combinación de eficiencia y opacidad probablemente se convertirá en uno de los grandes temas del comercio automatizado en los próximos años. La discusión ya no girará solo en torno a si los agentes pueden negociar, sino a quién benefician más cuando lo hacen.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Canadá
Sam Altman se disculpa con Tumbler Ridge por no alertar antes a la policía tras error con ChatGPT
Energía
EEUU: Gobierno de Maine veta moratoria a centros de datos y reabre debate energético
IA
Estudio señala a Grok como el modelo de IA más propenso a reforzar delirios
Análisis de mercado