Por Canuto  

Arena, la plataforma nacida en UC Berkeley que popularizó las comparaciones públicas entre modelos de inteligencia artificial, ya alcanzó USD $100 millones en ingresos anualizados apenas ocho meses después de lanzar su servicio comercial, una señal del enorme apetito del mercado por herramientas de evaluación y ajuste fino para IA.
***

  • Arena alcanzó USD $100 millones en ingresos anualizados ocho meses después de lanzar su servicio comercial.
  • La empresa monetiza con evaluaciones de IA para laboratorios y compañías, aunque su ranking público sigue siendo gratuito.
  • Su crecimiento refleja la fuerte demanda de servicios de post-entrenamiento en plena carrera por mejorar modelos de IA.

 


Arena, la plataforma conocida por su popular tabla de clasificación de modelos de inteligencia artificial, alcanzó USD $100 millones en ingresos anualizados apenas ocho meses después de lanzar su oferta comercial. La empresa nació como un proyecto de investigación en UC Berkeley en 2023 y hoy se perfila como una de las firmas más visibles dentro del naciente mercado de evaluación de modelos.

El dato llama la atención porque Arena construyó primero una comunidad y luego un negocio. Su sitio web para consumidores permite que una persona escriba un prompt que se envía a dos modelos distintos, tras lo cual el usuario decide cuál respondió mejor, reseña TechCrunch.

Esa mecánica, simple en apariencia, ha servido para recopilar más de 10 millones de evaluaciones de usuarios. Con esa base, Arena se convirtió en una referencia habitual para medir el rendimiento relativo de modelos de IA ante tareas reales y comparaciones cara a cara.

La tabla pública sigue siendo gratuita, pero el modelo comercial llegó en septiembre con el lanzamiento de AI Evaluations. Ese servicio ofrece a laboratorios de modelos y empresas análisis de rendimiento detallados, extraídos de la actividad y retroalimentación de la comunidad de evaluadores.

La historia de Arena también ilustra un cambio más amplio en el mercado de la inteligencia artificial. En esta etapa de la carrera tecnológica, ya no basta con entrenar modelos cada vez más grandes, porque también se ha vuelto crucial medir con precisión cómo se comportan en escenarios reales de uso.

De proyecto abierto a negocio multimillonario

Según explicó su cofundador y CEO, Anastasios Angelopoulos, muchas personas todavía no perciben a Arena como una empresa con ingresos significativos. En declaraciones citadas por TechCrunch, el ejecutivo afirmó que mucha gente aún ve a la organización como un proyecto de código abierto.

Esa percepción tiene lógica si se observa el origen académico de la plataforma. Arena comenzó como un esfuerzo de investigación en UC Berkeley y ganó notoriedad por ofrecer una clasificación pública y abierta de modelos de IA, en vez de una herramienta empresarial cerrada desde el primer día.

Sin embargo, la empresa logró convertir esa visibilidad en una línea de negocio concreta. En lugar de cobrar por acceso al ranking público, Arena monetiza vendiendo inteligencia de desempeño y análisis comparativos a quienes desarrollan o integran modelos de IA.

La rapidez del crecimiento también sobresale frente a su propia trayectoria reciente. Cuando Arena anunció en enero una ronda Serie A de USD $150 millones a una valoración post-money de USD $1.700 millones, su nivel de ingresos anualizados era de USD $30 millones.

Eso implica que, en pocos meses, la empresa más que triplicó esa cifra. El salto refuerza la idea de que la demanda por servicios especializados de evaluación y refinamiento de modelos está creciendo con fuerza entre laboratorios y compañías tecnológicas.

Hay, no obstante, un matiz importante en la forma de presentar esos ingresos. Aunque Arena usa el término ARR, que normalmente se asocia con ingresos recurrentes anualizados, Angelopoulos aclaró que los clientes pagan por consumo y que, por tanto, sus ingresos no son recurrentes en el sentido tradicional.

Qué vende exactamente Arena y por qué importa

La propuesta de Arena se apoya en una comunidad que participa activamente en comparaciones entre modelos. Muchos usuarios llegan a la plataforma atraídos por la posibilidad de probar de forma anticipada los modelos de IA más recientes, incluso algunos que todavía no han sido lanzados públicamente.

Esa dinámica le entrega a la empresa una ventaja valiosa. En vez de basarse solo en benchmarks cerrados o pruebas sintéticas, Arena reúne señales provenientes de interacción humana directa, algo especialmente relevante para modelos cuyo éxito depende de preferencias subjetivas y calidad percibida.

Con AI Evaluations, la firma tomó esos datos y los transformó en un producto vendible. La plataforma ofrece a los clientes análisis de desempeño detallados que ayudan a entender cómo responden los modelos en distintas tareas y bajo condiciones de uso más cercanas al mundo real.

Arena clasifica modelos en varias categorías. Entre ellas figuran texto, codificación, visión y generación de imágenes, además de flujos de trabajo complejos y de larga duración a través de su recientemente introducido Agent Mode o Modo Agente.

Ese último elemento es especialmente relevante para el rumbo actual del sector. A medida que la industria pasa de chatbots puntuales a agentes capaces de encadenar acciones, la capacidad de evaluar tareas largas y más complejas se vuelve un activo comercial importante.

Para lectores menos familiarizados con este segmento, el post-entrenamiento es la fase en la que un modelo ya entrenado se ajusta y afina para mejorar su utilidad práctica. Allí entran evaluaciones humanas, pruebas comparativas y ciclos de refinamiento que pueden elevar la calidad final del sistema.

Un mercado sin competidor directo, pero con rivales por presupuesto

Arena no enfrenta hoy un competidor directo claramente consolidado en su mismo formato, según la información disponible. Yupp, otra startup comunitaria enfocada en selección de modelos de IA, cerró en marzo, lo que dejó a Arena con más espacio en este nicho específico.

Aun así, la empresa no opera en un vacío competitivo. Angelopoulos señaló que Arena compite “por el mismo dólar” con compañías de etiquetado humano como Mercor, Surge y Scale AI, todas activas en el trabajo de refinar sistemas de IA durante el proceso posterior al entrenamiento.

La comparación es importante porque muestra cómo se está redistribuyendo el gasto en la economía de la IA. No todo el presupuesto va a chips, centros de datos o entrenamiento base, ya que una parte creciente se destina a mejorar desempeño, alineación y confiabilidad del modelo.

En la práctica, Arena vende una mezcla de señal comunitaria, visibilidad de benchmark y capacidad analítica. Eso puede resultar atractivo para laboratorios que necesitan evidencia rápida de cómo rinde un modelo frente a rivales o en tareas concretas antes de lanzarlo o ajustarlo.

Este auge no es exclusivo de Arena. TechCrunch situó el caso dentro de una tendencia más amplia en la que el apetito por servicios de refinamiento posterior al entrenamiento continúa en aumento, impulsado por la presión de los proveedores de IA por maximizar el rendimiento de sus modelos.

Esa presión tiene una razón económica clara. En un mercado donde los modelos se parecen cada vez más en capacidades generales, pequeñas diferencias en calidad, utilidad o preferencia del usuario pueden influir en contratos empresariales, adopción masiva y reputación técnica.

La fiebre del post-entrenamiento y los nombres detrás de Arena

El crecimiento de Arena encaja con otras señales de expansión en servicios ligados al entrenamiento y ajuste de IA. The Information reportó en abril que los ingresos anualizados brutos de Handshake para entrenamiento de IA casi se duplicaron desde enero, al pasar de USD $550 millones a casi USD $1.000 millones.

Ese mismo medio también indicó que los ingresos anualizados de Mercor superaron USD $1.000 millones a inicios de este año. La cifra representa un avance notable frente a los USD $500 millones registrados en septiembre del año pasado.

Visto en conjunto, el panorama sugiere que la infraestructura humana y analítica alrededor de la IA se está convirtiendo en una categoría propia de gran escala. No se trata solo de construir modelos, sino de medirlos, corregirlos y afinarlos con rapidez suficiente para seguir compitiendo.

Arena fue cofundada por Anastasios Angelopoulos y por su compañero de posdoctorado en UC Berkeley, Wei-Lin Chiang, quien se desempeña como CTO de la startup. También participó como cofundador Ion Stoica, reconocido profesor de UC Berkeley y cofundador de Databricks.

Stoica asesoró el proyecto antes de que se incorporara formalmente como empresa en abril de 2025. Ese detalle ayuda a explicar por qué Arena combina rasgos de investigación académica con una ejecución comercial que ha captado la atención de inversionistas y clientes empresariales.

Hasta la fecha, la startup ha recaudado un total de USD $250 millones. Entre sus inversionistas figuran Felicis, Andreessen Horowitz, The House Fund, LDVP, Kleiner Perkins, Lightspeed Venture Partners, Laude Ventures y UC Investments.

Más allá de las cifras, el caso Arena deja una lectura de fondo para el mercado tecnológico. Las plataformas que logren convertir comunidades activas, datos útiles y métricas confiables en productos para empresas podrían quedarse con una parte relevante del valor generado por la actual carrera de la IA.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín