JetBrains anunció la apertura de Mellum2, un nuevo modelo de IA para programación que busca competir no tanto por amplitud generalista, sino por velocidad, especialización y control. Su propuesta apunta a empresas que quieren ejecutar herramientas de codificación e IA agencial dentro de su propia infraestructura, sin depender de APIs de terceros.
***
- JetBrains liberó Mellum2 como modelo abierto de 12B parámetros, con solo 2.5B activos por token gracias a su arquitectura MoE.
- La empresa lo posiciona para tareas de IA agencial, recuperación de contexto, sub-agentes y despliegues privados en infraestructura propia.
- Según sus pruebas, Mellum2 destaca en velocidad bajo carga concurrente y en generación de código, aunque cede terreno en razonamiento general.
JetBrains anunció la liberación como código abierto de Mellum2, un modelo de codificación de 12.000 millones de parámetros orientado a una nueva capa de infraestructura dentro de los sistemas de IA para desarrollo de software. La propuesta busca cubrir tareas que van más allá del autocompletado de código, incluyendo rutas entre modelos, tuberías de recuperación, trabajo de sub-agentes y despliegue privado en instalaciones propias.
El movimiento coloca a la empresa en un terreno cada vez más relevante para la industria. A medida que más equipos de ingeniería integran asistentes de IA en sus flujos de trabajo, también crece el interés por soluciones que no obliguen a enviar inferencias a servicios externos. Ese es precisamente el ángulo donde JetBrains intenta diferenciar a Mellum2 frente a opciones como Claude Code, Codex y otras herramientas atadas a plataformas o APIs de terceros.
Mellum2 es la continuación de Mellum, un modelo de 4.000 millones de parámetros que JetBrains presentó a finales de 2024 como herramienta propietaria de finalización de código para sus propios IDE. Más tarde, en abril de 2025, aquella primera versión fue liberada como código abierto. En el caso de Mellum2, la apertura llega desde el primer día.
El alcance del nuevo sistema también es más ambicioso. Mientras Mellum estaba enfocado en una sola función, completar código, Mellum2 fue diseñado para el conjunto más amplio de tareas que hoy definen el despliegue de IA en ingeniería de software. Esto incluye coordinar distintos modelos, comprimir contexto en pipelines de recuperación y ejecutar inferencias dentro de infraestructura controlada por los propios equipos.
Un modelo focal, no un rival frontal de los gigantes
En una publicación de blog firmada por el ingeniero de investigación Nikita Pavlichenko y el gerente de producto Anton Semenkin, JetBrains describe a Mellum2 como un “modelo focal”. Con esa etiqueta, la empresa intenta dejar claro que no busca competir de manera directa con los llamados modelos de frontera en amplitud general, sino ofrecer un componente especializado, rápido y eficiente para tareas recurrentes de desarrollo.
Los autores sostienen que los productos de IA prácticos no solo necesitan modelos gigantes y versátiles. También requieren piezas especializadas que resuelvan con agilidad operaciones frecuentes dentro de sistemas mayores. Según su planteamiento, esa especialización es la que permite a Mellum2 rendir bien en entornos de ingeniería de software sin perder velocidad operativa.
JetBrains lanzó además dos variantes post-entrenadas junto al modelo base. Una de ellas es la versión “instruct”, pensada para responder de forma directa. La otra es la versión “thinking”, capaz de producir un rastro de razonamiento explícito antes de responder, con foco en tareas más complejas, de varios pasos y de naturaleza agencial.
Ese detalle es importante porque evidencia cómo el mercado de IA para programación está cambiando. Ya no se trata solo de sugerir líneas de código dentro de un editor, sino de integrar agentes, recuperación de documentación, herramientas de contexto y automatizaciones que operan sobre repositorios, bases de conocimiento y sistemas internos.
Arquitectura MoE y enfoque en velocidad bajo carga real
Mellum2 utiliza una arquitectura Mixture-of-Experts, o MoE. Aunque el modelo suma 12.000 millones de parámetros, solo 2.500 millones están activos por token. El objetivo de este diseño es que cada token atraviese solo un subconjunto de los 64 expertos del modelo, en lugar de pasar por toda la red, algo que reduce el costo de inferencia sin limitar tanto la capacidad.
JetBrains comparó a Mellum2 con Qwen2.5-7B y Qwen3-8B de Alibaba en una sola GPU H100. La empresa usó tamaños de entrada y salida que, según explicó en su informe técnico, representan cargas de trabajo reales de finalización de código en producción. En solicitudes individuales, Mellum2 prácticamente empató con Qwen2.5-7B, al registrar 192 tokens por segundo frente a 193.
La diferencia aparece con más claridad bajo carga concurrente, que es donde realmente funcionan muchos despliegues empresariales. En ese escenario, JetBrains asegura que Mellum2 supera en 21% a Qwen2.5-7B y en 79% a Qwen3-8B. Para organizaciones que procesan grandes volúmenes de solicitudes dentro de sistemas agenciales, esa mejora puede traducirse en menores tiempos de espera y más previsibilidad operativa.
La empresa también argumenta que el costo de inferencia sigue la misma lógica. Debido a que solo 2.500 millones de parámetros se activan por token, la arquitectura debería comportarse más como un modelo de 2.500 millones que como uno denso de 12.000 millones en términos de operación. Esa promesa es especialmente relevante para equipos que necesitan ejecutar el modelo a gran escala de forma diaria.
Buen rendimiento en código, pero con concesiones deliberadas
En generación de código a nivel de funciones, Mellum2 mostró resultados sólidos en el benchmark EvalPlus, que combina HumanEval+ y MBPP+. Su variante “thinking” obtuvo 78,4%, por encima de otros modelos incluidos en la tabla comparativa de JetBrains. Entre ellos figuran Qwen3.5-9B, con 71,8%, y Seed-Coder-8B, con 73,8%.
Sin embargo, el panorama cambia cuando la evaluación se extiende más allá de la ingeniería de software. Los propios resultados de JetBrains muestran que Qwen3.5-9B conserva ventaja en pruebas de razonamiento y conocimiento más generales, como GPQA Diamond y MMLU-Redux. En otras palabras, Mellum2 parece rendir mejor cuando el problema se mantiene cerca del dominio para el que fue entrenado.
JetBrains reconoce ese punto de forma explícita en su informe técnico. Según la empresa, la brecha responde a una decisión intencional dentro de la mezcla de entrenamiento, priorizando código y documentación para desarrolladores en lugar de una cobertura enciclopédica más amplia. No se trata, por tanto, de una debilidad no prevista, sino del costo asumido por su especialización.
Ese equilibrio puede resultar aceptable para muchas empresas. En entornos corporativos, no siempre se busca un asistente generalista capaz de hablar de cualquier tema. A menudo se valora más un modelo que resuelva con rapidez tareas muy concretas, con menor dependencia externa y mejor control de la infraestructura donde operará.
La batalla por la dependencia de APIs
Quizás el argumento más fuerte de Mellum2 no está solo en sus métricas, sino en lo que evita. De acuerdo con The New Stack, herramientas como Claude Code de Anthropic y Codex de OpenAI funcionan localmente en el cliente, pero envían la inferencia a través de las APIs de sus respectivas compañías. Eso limita el grado de control que tienen los usuarios sobre una capa crítica de la operación.
El texto también menciona a Cursor, que ha estado experimentando con su propia estrategia de modelos propietarios y presentó recientemente Composer 2.5. Sin embargo, esas capacidades siguen ligadas a la plataforma de Cursor. Además, su asociación anunciada con xAI añade otra capa externa en infraestructura y desarrollo futuro de modelos, fuera del control directo de los clientes.
Mellum2 se distribuye con pesos abiertos bajo licencia Apache 2.0, lo que da a las empresas la posibilidad de poseer y operar ese componente por sí mismas. Para sectores con exigencias de cumplimiento, privacidad, residencia de datos o políticas estrictas de seguridad, este punto puede ser tan relevante como el rendimiento del modelo.
JetBrains está apostando a que la flexibilidad de despliegue, el control operativo y la propiedad de la infraestructura seguirán pesando cada vez más a medida que la IA penetre con mayor profundidad en los flujos de trabajo de desarrollo. La tesis parece razonable, aunque todavía queda por ver si ese argumento será suficiente para imponerse a escala empresarial frente a la comodidad de las soluciones gestionadas.
Por ahora, Mellum2 ya está disponible en Hugging Face con sus puntos de control base, instruct y thinking, todos publicados bajo Apache 2.0. Junto al lanzamiento, JetBrains también difundió el informe técnico completo con detalles sobre su arquitectura y su pipeline de entrenamiento, una señal clara de que busca atraer tanto a empresas como a desarrolladores interesados en operar IA de codificación dentro de infraestructura propia.
ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.
Suscríbete a nuestro boletín
Artículos Relacionados
Empresas
Datacenters espaciales: por qué la IA en órbita aún cuesta más de 4 veces que en la Tierra
IA
GPT superó a Claude y Gemini en prueba de hackeo con IA sobre app vulnerable y Firebase
Hardware
Google lanza Gemma 4 12B, un modelo multimodal que promete IA avanzada en laptops
Análisis de mercado