Sail Research salió de la clandestinidad con una ronda total de USD $80 millones y una valoración de USD $450 millones, apostando por un nicho crítico de la inteligencia artificial: reducir el costo de ejecutar agentes autónomos de larga duración. La startup, fundada por exingenieros de Apple y Together AI, promete mejoras de entre 3x y 10x en eficiencia al exprimir más trabajo de las mismas GPUs.
***
- Sail Research recaudó USD $80 millones entre financiamiento semilla y Serie A, liderada por Kleiner Perkins.
- La empresa apunta a agentes de IA que operan durante horas y consumen entre 50 y 500 veces más tokens que un chatbot.
- Su plataforma sacrifica baja latencia para maximizar rendimiento y, según su cofundador, reducir costos entre 3x y 10x.
Sail Research, una startup de infraestructura para inteligencia artificial, salió de la clandestinidad con financiamiento semilla y Serie A por un total de USD $80 millones. La operación se cerró con una valoración de USD $450 millones.
Kleiner Perkins lideró la Serie A. También participaron Sequoia, Redpoint, Theory Ventures, Vine Ventures y CRV.
La compañía fue fundada por Neil Movva, de 28 años, junto con Samir Menon. Ambos decidieron reconstruir la pila de inferencia desde cero para atender una clase de cargas de trabajo que, a su juicio, está siendo subestimada.
El problema que buscan resolver no gira en torno a los chatbots tradicionales. Su tesis es que la próxima ola de IA empresarial estará dominada por agentes autónomos capaces de trabajar durante horas sobre miles de tareas simultáneas.
Ese cambio de uso tiene implicaciones económicas relevantes para el sector tecnológico. También resulta importante para inversionistas y mercados, porque la eficiencia computacional se perfila como uno de los cuellos de botella más sensibles de la expansión de la IA.
Una apuesta por agentes de larga duración, no por chats instantáneos
Durante meses, el socio de Kleiner Perkins Aditya Naganath estuvo desarrollando una tesis de inversión específica. Según explicó a Fortune, creía que la siguiente fase de la IA no sería otro chatbot, sino software que ejecuta trabajo autónomo durante largos periodos.
El obstáculo era claro desde el inicio. Nadie había construido todavía la infraestructura adecuada para sostener ese tipo de inferencia a escala.
Ese diagnóstico cambió cuando conoció a Neil Movva. Naganath dijo que a ambos les resultó evidente que haría falta una plataforma de inferencia diseñada específicamente para agentes de larga duración.
La diferencia frente a la infraestructura actual es profunda. Buena parte de la arquitectura de servicios de IA fue creada para intercambios rápidos y puntuales, como una respuesta breve en un chatbot.
Las empresas, sin embargo, están adoptando agentes que operan sin supervisión humana directa durante horas. Esos sistemas pueden revisar bases de código completas, filtrar cientos de candidatos laborales o investigar asuntos complejos sin intervención constante de una persona.
En ese contexto, los costos se disparan aunque el precio por token haya bajado. La razón es que los flujos de trabajo agénticos consumen tokens a un ritmo entre 50 y 500 veces superior al de un chat simple.
La presión sobre el gasto no es menor para las compañías que despliegan estas herramientas. Según la información citada por la fuente, las facturas de IA empresarial ya se han triplicado bajo esa nueva dinámica de uso.
El panorama a futuro luce todavía más exigente. Goldman Sachs proyecta un aumento de 24 veces en el consumo de tokens para 2030.
Cómo funciona Sail y por qué sacrifica velocidad para ganar eficiencia
La propuesta técnica de Sail es una plataforma de infraestructura de extremo a extremo construida desde el nivel más bajo del chip hacia arriba. En esencia, la empresa desarrolla software para orquestar y optimizar cómo los modelos de IA se ejecutan sobre chips ya existentes.
La idea puede entenderse como un sistema de tráfico para hardware. Ese software indica con precisión cómo asignar recursos computacionales para extraer mucho más trabajo de la misma capacidad física disponible.
La mayoría de las plataformas de servicio de IA se optimizan para baja latencia. Eso significa priorizar que una respuesta llegue lo más rápido posible al usuario final.
Sail toma la ruta opuesta. La empresa sacrifica capacidad de respuesta en tiempo real para empaquetar mucho más trabajo computacional dentro de cada unidad de energía consumida.
Esa renuncia no es accidental. Movva explicó a Fortune que su compañía no puede alimentar un asistente de voz o un chatbot en vivo, porque su prioridad no es la inmediatez.
El enfoque apunta a otro mercado. Para agentes que trabajan durante horas, Movva asegura que los clientes suelen ver mejoras de costos de entre 3x y 10x frente a alternativas comparables.
Su mensaje estratégico también es directo. “Solo nos importa la eficiencia”, dijo Movva.
El fundador añadió que es bastante difícil construir un motor de inferencia que optimice al mismo tiempo para rendimiento y latencia. Según su planteamiento, otros actores privilegian la latencia, mientras Sail se enfoca únicamente en el rendimiento.
Este matiz ayuda a entender por qué la empresa ha llamado la atención de capital de riesgo. En un mercado donde la escasez de GPU y el costo energético pesan cada vez más, lograr más trabajo por watt puede convertirse en una ventaja comercial real.
La trayectoria de Neil Movva y el origen de la tesis de la startup
Movva forma parte de un grupo reducido de ingenieros que ha trabajado en varias capas relevantes de la pila de IA. Esa experiencia es uno de los elementos que sostiene la credibilidad técnica de la empresa ante inversionistas y clientes.
Según el relato del fundador, observó de cerca cómo NVIDIA pasó de los chips para videojuegos al silicio orientado a IA entre 2016 y 2017. Ese cambio definió buena parte de la infraestructura que hoy domina el sector.
Después se unió a Apple. Allí trabajó en el chip que impulsa funciones de visión por computadora en mil millones de iPhones.
Movva dijo que terminó frustrado por el alcance de esa ambición dentro de Apple. En su versión, la apuesta de la compañía estaba demasiado limitada a casos como los animoji que los usuarios pueden aplicar en FaceTime.
Más tarde pasó a Together AI, uno de los principales proveedores de inferencia para modelos de código abierto. Ese retorno al trabajo a nivel de GPU terminó de consolidar la tesis central de Sail.
Lo que vio en Together AI fue, según explicó, una arquitectura construida para aplicaciones interactivas. Por eso, dijo, la empresa había aceptado sacrificios de diseño coherentes con esa prioridad de uso.
Desde su perspectiva, los agentes de largo plazo requerían algo distinto. No bastaba con adaptar infraestructura diseñada para chats rápidos, sino que hacía falta construir una plataforma nueva con prioridades diferentes.
El cofundador y CTO, Samir Menon, también viene de Apple, donde trabajó en ingeniería de seguridad a gran escala. Ambos se conocieron el primer día de su primer año en Stanford, tomaron las mismas clases y hasta compartieron consejero académico.
Movva incluso bromeó con que Menon tuvo calificaciones ligeramente mejores. Los dos se reencontraron a finales de 2025 para levantar una empresa centrada en reconstruir la inferencia desde la base.
Crecimiento temprano, caso de uso real y el nuevo costo de los tokens
Sail lanzó su servicio de inferencia en marzo. Desde entonces, según la compañía, ya escaló el procesamiento hasta trillones de tokens por semana.
Esa cifra busca mostrar que la empresa no solo está desarrollando tecnología experimental. También apunta a demostrar que su producto ya soporta volúmenes sustanciales en producción.
Uno de sus primeros clientes es Detail.dev. La firma utiliza Sail para ejecutar agentes de revisión de código que trabajan durante tres a cuatro horas, y a veces más, sobre una base de código completa.
El objetivo de esos agentes es detectar errores que una revisión de cinco minutos podría pasar por alto. El caso ilustra bien la diferencia entre un sistema conversacional y una carga de trabajo prolongada, intensiva y menos sensible a la latencia.
Movva dijo que la abundancia de tokens que su infraestructura ofrece permite a esos clientes ser “máximamente ambiciosos” en la manera en que inspeccionan bases de código. En otras palabras, cuando el costo marginal baja, el alcance del análisis puede crecer.
Este punto resulta clave para entender por qué la inferencia se ha convertido en un asunto estratégico. El abaratamiento por token no necesariamente reduce la factura final si el volumen consumido crece mucho más rápido.
Por eso la oportunidad de negocio no depende solo de vender acceso a modelos. También depende de administrar de forma más eficiente la ejecución sobre hardware escaso y caro.
Para lectores nuevos en este tema, la lógica es similar a la de centros de datos o minería digital. Si una empresa logra extraer más trabajo del mismo equipo físico, mejora sus márgenes y puede competir mejor incluso en mercados donde los precios unitarios bajan.
Competencia, riesgos y el tamaño potencial del mercado
El riesgo competitivo para Sail es real. Together AI aparece como un rival formidable, y además también forma parte del portafolio de Kleiner Perkins.
Naganath sostiene que ambas empresas no están en conflicto directo. Según su visión, Together domina el mercado interactivo y basado en chat, mientras Sail se enfoca en la carga de trabajo de agentes de larga duración.
Su argumento es que la especificidad terminará imponiéndose. “Ser específico y construido para un propósito debería ganar a largo plazo”, dijo.
La amenaza más grande, no obstante, podría venir desde los grandes laboratorios de IA. Anthropic, OpenAI y Google están construyendo su propia infraestructura de inferencia, y en teoría podrían comoditizar la capa sobre la que Sail está apostando.
Movva respondió a esa objeción con una lectura de mercado distinta. Afirmó que los precios de los tokens se han mantenido estables o incluso al alza durante seis meses.
También sostuvo que la demanda de computación está creciendo más rápido que la oferta disponible. Bajo esa lógica, aún habría espacio para actores obsesionados con extraer la mayor inteligencia posible de cada GPU.
Su frase más gráfica refleja bien la cultura técnica que quiere vender la empresa. “Sentimos un dolor emocional cuando vemos un GPU inactivo o desperdiciado de cualquier manera”, afirmó.
Para Naganath, el caso alcista es simple y enorme a la vez. Su creencia es que la inferencia terminará siendo un mercado 10x e incluso 100x más grande de lo que es hoy.
Si ese escenario se materializa, compañías como Sail podrían capturar una porción valiosa de la nueva cadena de valor de la IA. No porque construyan el modelo más visible, sino porque optimizan el motor silencioso que permite correrlo de forma rentable.
La lectura final para el mercado es clara. A medida que los agentes autónomos ganen peso en software empresarial, la batalla ya no será solo por mejores modelos, sino por quién logra ejecutarlos con menor costo, menor desperdicio y mayor escala.
Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.
Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Estados Unidos
Trump propone eliminar el pedal de freno en vehículos autónomos y despeja el camino a Tesla
Artículos
MIT propone modelo para puentes y edificios con menos material y menor huella de carbono
Empresas
Ford readmite ingenieros tras fallas de IA y automatización en calidad vehicular
Noticias