Por Canuto  

Open Swarm, presentado por Arseny Shatokhin, entra al debate sobre los agentes de IA con una propuesta abierta, modular y centrada en resultados prácticos. El sistema busca ejecutar desde una terminal tareas complejas como research, análisis de datos, presentaciones y documentos, coordinando varios agentes especializados a partir de una sola instrucción.
***

  • Open Swarm fue presentado como un sistema multiagente totalmente open source que opera desde la terminal.
  • El proyecto integra ocho agentes especializados para tareas como investigación, slides, análisis de datos, documentos, imágenes y video.
  • Su creador sostiene que el modelo puede personalizarse en minutos para casos de uso como SEO, ventas, marketing, legal o finanzas.


El ecosistema de agentes de inteligencia artificial sigue avanzando hacia modelos más especializados, y ahora suma una nueva propuesta enfocada en automatizar trabajo complejo desde una sola interfaz. Open Swarm, presentado por Arseny Shatokhin, fue lanzado como un sistema completamente open source que busca producir entregables reales, no solo respuestas conversacionales.

La promesa central del proyecto es ambiciosa. Según su creador, el sistema puede ejecutar desde una terminal tareas que abarcan presentaciones, documentos, research profundo, análisis de datos, imágenes y otros formatos, todo a partir de un solo prompt y sin depender de una plataforma cerrada.

La presentación de Introducing OpenSwarm, a cargo de Arseny Shatokhin, plantea que la demanda de 2026 ya no se concentra en chatbots básicos. En su lugar, empresas y clientes estarían buscando agentes capaces de entregar productos de trabajo completos, utilizables y listos para contextos de negocio.

Ese contexto ayuda a explicar por qué varios desarrolladores están migrando desde asistentes generalistas hacia sistemas multiagente. En vez de delegar todo en un único modelo, el enfoque consiste en dividir el trabajo entre especialistas coordinados, con el objetivo de mejorar calidad, reducir ruido contextual y disminuir errores.

Una apuesta abierta frente a soluciones cerradas

Shatokhin explicó que el proyecto nació a partir del trabajo de su agencia de desarrollo de IA, donde varios clientes pedían integrar agentes en productos SaaS propios. Según su relato, esos clientes querían sistemas capaces de crear propuestas, reportes, audio, video o decks, en lugar de limitarse a responder mensajes.

En esa comparación, señaló que Claude Code resulta muy sólido para tareas de programación, pero no puede generar por sí mismo una presentación de diapositivas completa como producto final. También afirmó que Open Claw puede intentarlo mediante automatización de navegador, aunque la calidad todavía no alcanzaría el nivel esperado para entregables de alto valor.

Como ejemplo, el autor mencionó que su equipo usó Open Swarm para desarrollar una propuesta personalizada para un cliente importante, relacionada con un proyecto multimensual superior a USD $100.000. Añadió que comparó ese trabajo con resultados obtenidos usando Minus y GenSpark, y sostuvo que fueron notablemente peores.

En ese mismo marco, indicó que Anthropic también habría identificado esa brecha al lanzar Co-work. Sin embargo, remarcó que esa alternativa sigue siendo cerrada, no personalizable y dependiente de un ecosistema específico, razón por la que decidieron construir una opción abierta.

Cómo funciona Open Swarm y qué agentes incluye

Open Swarm fue descrito como un sistema multiagente totalmente open source donde cada agente se especializa en un tipo concreto de trabajo. La instalación, de acuerdo con la demostración, se realiza con un solo comando, usando suscripciones ya existentes de OpenAI o Anthropic para conservar los límites superiores de tokens.

Dentro del sistema operan ocho agentes especializados. Entre ellos figura un orquestador que coordina al resto, un agente generalista para tareas amplias, un agente de slides para presentaciones, uno de deep research, otro de análisis de datos, un agente de documentos y agentes dedicados a imagen y video.

La lógica del proyecto es que ningún agente intente hacerlo todo mal. En su lugar, cada uno se enfoca en una tarea definida y luego entrega información procesada al siguiente, mientras el orquestador organiza la secuencia completa y ajusta el flujo cuando hace falta.

Shatokhin subrayó además una capacidad que considera diferencial: la comunicación entre agentes con transferencia de contexto. Puso como ejemplo la creación de una propuesta seguida por una factura en la misma conversación, donde el agente de slides cede paso al de documentos sin perder la información previa del trabajo.

Una demostración con pitch para inversionistas

Para mostrar el sistema en acción, el autor introdujo una sola instrucción en la terminal: crear un pitch completo para inversionistas sobre Open Swarm. A partir de allí, el agente orquestador comenzó a dividir el pedido en subtareas y a decidir qué especialistas debía convocar y en qué orden.

Primero intervino el agente de investigación profunda, encargado de reunir datos de mercado, frameworks de agentes de IA, competidores y tendencias. Según la explicación, el material obtenido desde la web no quedó como una lista caótica de resultados, sino como un documento limpio y estructurado.

Después, el orquestador transfirió ese material al agente de análisis de datos. Ese especialista transformó la investigación en tablas, proyecciones de crecimiento, mapas competitivos y gráficos vinculados a métricas como TAM y SAM, buscando un nivel más cercano al trabajo de un analista real.

Luego llegó una de las piezas centrales del sistema: el agente de presentaciones. Allí, Shatokhin explicó que incluso ese módulo usa un enfoque por subagentes, donde un agente principal diseña la estructura y el estilo del deck, mientras otros se ocupan de las diapositivas de forma individual.

El resultado final, según la demostración, fue una presentación diseñada, con datos de mercado, gráficos, resumen ejecutivo y one-pager. Además, afirmó que el documento puede exportarse a formatos como PDF o PowerPoint, ampliando su utilidad para contextos empresariales e institucionales.

Comparaciones, tiempos de ejecución y trabajo prolongado

La presentación también incluyó una comparación lado a lado entre Open Swarm, Claude Code y Open Claw usando el mismo prompt. En esa muestra, Claude Code generó un archivo en markdown con viñetas generales, mientras Open Claw produjo unas pocas diapositivas con texto genérico mediante automatización de navegador.

Frente a eso, Shatokhin sostuvo que Open Swarm entregó un paquete completo con deck visual, gráficos, resumen ejecutivo y un documento de apoyo. Esa comparación fue utilizada para reforzar la idea de que la coordinación entre especialistas permite mayor calidad que un único agente manejando todo el flujo.

Otro dato relevante fue el tiempo. El creador dijo que el proceso completo del pitch tomó alrededor de 15 minutos, aunque añadió que ya han probado tareas de hasta 4 horas sin alcanzar todavía el límite operativo del sistema.

Según su explicación, esa resistencia a trabajos largos se apoya en la separación de funciones. Como cada agente maneja su propia parte, el orquestador puede reintentar o corregir un módulo sin colapsar el flujo general, algo importante cuando los procesos duran mucho tiempo.

Personalización, terminal y creación de nuevos swarms

Más allá del caso de uso base, la propuesta pone un énfasis fuerte en la personalización. Open Swarm corre sobre una interfaz de terminal basada en Open Code, que el autor describió como una de las mejores opciones open source para agentes de IA orientados a programación.

Esa base aporta funciones como gestión de sesiones, referencias a archivos con el símbolo @, deshacer y rehacer, exportación de sesiones y uso intensivo de teclado. El sistema también permite cambiar de agente con el comando /agents, agrupando los disponibles por swarm.

Una ventaja destacada es el acceso a archivos locales. En la demostración se explicó que el orquestador o el agente general pueden revisar el sistema de archivos, identificar el contexto más relevante de un proyecto y usarlo para producir resultados que suenen más cercanos al usuario.

Shatokhin aseguró además que cualquier desarrollador puede bifurcar el repositorio y construir su propio swarm especializado en minutos. La estructura se organiza por carpetas de agentes con prompts y herramientas específicas, además de recursos compartidos en el nivel superior.

El proceso de personalización, según la explicación, se simplifica con un archivo agents.md que resume el contexto necesario para adaptar el framework. De ese modo, una herramienta de codificación con IA podría leer el repositorio y transformar el swarm original en uno dedicado a otra vertical sin reescribirlo a mano.

Del SEO a marketing, legal y finanzas

Como ejemplo concreto, el autor mostró cómo convertir Open Swarm en un sistema especializado en SEO. En ese caso, el agente de research pasó a funcionar como planificador de keywords, el de documentos como redactor de posts y el analista de datos como módulo para extraer señales desde Search Console y GA4.

También explicó que el agente generalista asumiría tareas de SEO técnico, como schema markup y auditorías del sitio. Tras ese ajuste, el sistema podía ejecutarse con el mismo comando de antes, pero como un nuevo swarm ya orientado a resultados de posicionamiento y conversión.

La prueba consistió en pedirle que investigara cinco competidores, detectara oportunidades de palabras clave y escribiera tres posts optimizados para keywords de fondo de embudo. El resultado, de acuerdo con la demostración, incluyó research de keywords, análisis competitivo y tres artículos listos para publicar.

Desde ahí, la visión se amplía. Shatokhin planteó que el mismo esquema puede llevarse a ventas, marketing, soporte al cliente, legal, finanzas y prácticamente cualquier dominio de trabajo del conocimiento donde convenga coordinar especialistas con contexto compartido.

Lo que viene para el proyecto

En la parte final, el creador adelantó varias líneas de desarrollo. Entre ellas mencionó la integración directa de Open Claw, Codex y Claude Code dentro del sistema, con la idea de que distintos agentes colaboren desde una sola terminal bajo coordinación del orquestador.

También habló de un futuro “agent builder agent”, pensado para que el usuario simplemente describa qué tipo de swarm necesita y el sistema construya automáticamente toda la arquitectura necesaria. De concretarse, esa función reduciría aún más la barrera de entrada para crear agentes especializados.

Más allá del entusiasmo del lanzamiento, el proyecto todavía deberá probar su desempeño fuera de la demostración presentada por su propio creador. En especial, quedará por ver qué tan consistente resulta en implementaciones reales, qué costos implica a escala y cómo evoluciona frente a competidores comerciales.

Sin embargo, la presentación deja clara una señal de mercado: el interés ya no está solo en conversar con la IA, sino en ponerla a producir entregables concretos. En ese cambio, Open Swarm intenta posicionarse como una infraestructura abierta para automatizar trabajo complejo desde la terminal.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA y revisado por un editor humano para garantizar calidad y precisión.


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín