Por Canuto  

Moonshot AI presentó Kimi K2.7 Code, un modelo abierto enfocado en programación y flujos de trabajo con agentes que no supera a GPT-5.5 o Claude en la mayoría de las pruebas, pero sí altera el mercado con una estructura de precios mucho más baja y mejoras claras frente a su versión previa.

***

  • Moonshot AI lanzó Kimi K2.7 Code como modelo de pesos abiertos en Hugging Face, orientado a tareas complejas de programación.
  • El sistema mejora frente a K2.6 en benchmarks de código y agentes, aunque sigue por detrás de GPT-5.5 y Claude Opus 4.8 en varias pruebas.
  • Su precio de API, de USD $0,95 por millón de tokens de entrada y USD $4,00 por millón de tokens de salida, lo ubica muy por debajo de competidores occidentales.

 


Moonshot AI anunció el lanzamiento de Kimi K2.7 Code, un nuevo modelo de inteligencia artificial (IA) diseñado de forma específica para tareas de programación y flujos de trabajo de codificación basados en agentes.

La compañía puso el modelo a disposición como una versión de pesos abiertos en Hugging Face, reforzando su apuesta por competir no solo en rendimiento, sino también en accesibilidad y costo.

El nuevo sistema se construye sobre Kimi K2.6, su predecesor inmediato. Según la empresa, el objetivo principal de esta iteración es mejorar el desempeño en tareas de ingeniería de software complejas y de largo horizonte.

Para usos generales fuera de la programación, Moonshot AI sigue recomendando K2.6. Esa distinción sugiere una estrategia de especialización, cada vez más común en el mercado de modelos fundacionales.

En el ecosistema de herramientas para desarrolladores, Kimi ya tenía cierta presencia. El artículo original de The Decoder recuerda que Cursor, proveedor de herramientas de codificación, revende este modelo en una forma modificada.

Mejoras frente a K2.6, pero sin desplazar a los líderes

Moonshot asegura que K2.7 Code registra avances relevantes frente a K2.6 en varias pruebas internas y externas de codificación. Esas mejoras abarcan tanto benchmarks tradicionales como evaluaciones centradas en agentes.

En Kimi Code Bench v2, una prueba interna de la empresa, el resultado sube de 50,9 a 62,0. En Program Bench, el puntaje pasa de 48,3 a 53,6.

En MLS Bench Lite, el modelo también mejora con un salto de 26,7 a 35,1. Estos avances muestran que la actualización no fue marginal, al menos según las métricas compartidas por la compañía. Las ganancias también aparecen en benchmarks orientados a agentes. En MCP Atlas, K2.7 Code alcanza 76,0 frente a 69,4 de la versión anterior.

En MCPMark Verified, el rendimiento mejora de 72,8 a 81,1. Ese punto es importante porque la industria ha empezado a prestar más atención a pruebas que miden interacción con software real, no solo resolución de ejercicios aislados.

Sin embargo, la comparación con modelos occidentales de referencia sigue siendo desfavorable en la mayoría de los exámenes de codificación. GPT-5.5 obtiene 69,1 en Program Bench, por encima del 53,6 de K2.7 Code.

En Kimi Code Bench v2 ocurre algo similar. GPT-5.5 marca 69,0, mientras K2.7 Code queda en 62,0.

Program Bench es una prueba particularmente exigente. Allí, los agentes deben reproducir el comportamiento de un programa usando solo un binario compilado y su documentación, sin acceso al código fuente, sin descompilación y sin internet.

Ese tipo de test intenta medir algo más cercano al trabajo real de un agente autónomo de software. Por eso, aunque las cifras no colocan a Kimi en la cima, sí aportan contexto sobre el tipo de tareas en las que puede resultar útil.

El caso más destacado aparece en MCPMark Verified. En ese benchmark, K2.7 Code supera a Claude Opus 4.8 con 81,1 frente a 76,4.

Aun así, la ventaja no le alcanza para acercarse a GPT-5.5, que en esa misma prueba consigue 92,9. La diferencia deja claro que Moonshot compite con una propuesta fuerte en costo, pero no con supremacía general en calidad.

Arquitectura masiva, contexto amplio y menos tokens de pensamiento

K2.7 Code utiliza una arquitectura de Mezcla de Expertos, o MoE, con 1 billón de parámetros totales, de acuerdo con la ficha técnica del modelo. Esa cifra lo ubica entre los sistemas más ambiciosos del mercado en volumen bruto.

No obstante, solo 32 mil millones de parámetros están activos por token. El modelo cuenta con 384 expertos y selecciona ocho por token durante la inferencia.

La longitud de contexto asciende a 256.000 tokens. Ese rango permite manejar bases de código extensas, documentación técnica amplia y conversaciones largas dentro de un mismo hilo de trabajo.

El sistema también es multimodal. Puede procesar imágenes y videos además de texto, gracias a un codificador de visión personalizado llamado MoonViT, que tiene 400 millones de parámetros.

Moonshot señala que la arquitectura es idéntica a la de K2.5 y K2.6. En términos prácticos, eso implica que despliegues ya configurados para esas versiones pueden reutilizarse directamente sin rediseños profundos.

Una de las mejoras que la empresa presenta como clave es un razonamiento más eficiente. K2.7 Code usa alrededor de 30% menos tokens de pensamiento que K2.6.

Esa reducción apunta a disminuir el llamado sobrepensamiento, un fenómeno que puede elevar costos y latencia sin traducirse necesariamente en mejores respuestas. En entornos de producción, esa eficiencia suele ser tan importante como la precisión bruta.

El modelo incorpora un modo de pensamiento y otro llamado preservar_el_pensamiento. Este último mantiene el contenido de razonamiento a través de múltiples turnos de conversación para mejorar el desempeño en escenarios de codificación basados en agentes.

Moonshot también anunció un “Modo de Alta Velocidad 6x” que llegará próximamente. Por ahora, K2.7 Code puede usarse mediante la Kimi API, la herramienta Kimi Code CLI y motores de inferencia como vLLM y SGLang.

La empresa ofrece además una cuantización nativa INT4. Esa opción facilita ejecutar el modelo en hardware menos potente o de menor costo, algo especialmente atractivo para equipos que buscan autonomía operativa.

La gran apuesta de Moonshot está en el precio

Donde K2.7 Code realmente busca romper el mercado es en la estructura de tarifas. El precio de la API fue fijado en USD $0,95 por millón de tokens de entrada y USD $4,00 por millón de tokens de salida.

Si hay aciertos de caché, el costo de entrada baja a USD $0,19 por millón de tokens. En ese punto, el nuevo modelo mantiene el mismo precio base de K2.6, que también cobraba USD $0,95 por entrada y USD $4,00 por salida, con caché de USD $0,16.

La diferencia frente a los competidores occidentales es muy amplia. GPT-5.5 cuesta USD $5,00 por millón de tokens de entrada y USD $30,00 por millón de tokens de salida.

Claude Opus 4.8 cobra USD $5,00 por entrada y USD $25,00 por salida. Claude Fable 5, el modelo principal más reciente de Anthropic mencionado en la nota, sube todavía más, con USD $10,00 por entrada y USD $50,00 por salida.

Solo en salida, Claude Fable 5 resulta más de doce veces más caro que K2.7 Code. Esa brecha ayuda a explicar por qué Moonshot puede atraer a empresas que priorizan volumen de uso y control del presupuesto.

La lectura económica es directa. Aunque K2.7 Code no gane en todos los benchmarks, el mismo presupuesto permite ejecutarlo muchas más veces. Eso cambia la pregunta para compradores y equipos técnicos. En lugar de preguntarse solo cuál es el mejor modelo absoluto, la decisión pasa a ser si uno es lo bastante bueno para una tarea concreta al costo correcto.

En despliegues intensivos, esa diferencia se amortiza rápido. El costo por token se está convirtiendo en un factor competitivo tan importante como la calidad cruda del modelo.

Ese punto resulta familiar para quienes siguen mercados tecnológicos y financieros. Cuando un insumo medible cae de precio con fuerza, la presión no se limita al producto barato, sino que se extiende a toda la estructura competitiva del sector.

Por eso, el lanzamiento de K2.7 Code puede leerse como una señal de una economía de tokens cada vez más definida. En esa economía, capacidad, latencia, eficiencia y licencia pesan casi tanto como los rankings de laboratorio.

Licencia, acceso abierto y lo que implica para el mercado

K2.7 Code se distribuye bajo una licencia MIT modificada. Esa licencia permite usar, modificar y redistribuir el modelo de manera gratuita bajo ciertas condiciones.

La cláusula más relevante apunta a grandes clientes comerciales. Cualquier empresa que utilice K2.7 Code o derivados en productos con más de 100 millones de usuarios activos mensuales, o más de USD $20 millones en ingresos mensuales, debe mostrar de forma prominente “Kimi K2.7 Code” en la interfaz de usuario.

Ese detalle no bloquea el uso comercial, pero sí introduce una exigencia de atribución para actores de gran escala. En la práctica, Moonshot intenta equilibrar apertura con reconocimiento de marca.

El acceso mediante Hugging Face, la compatibilidad con motores como vLLM y SGLang, y la cuantización INT4 dibujan una estrategia orientada a adopción amplia. No se trata solo de vender API, sino también de facilitar que terceros integren, adapten y operen el modelo por su cuenta.

Para desarrolladores independientes, startups y equipos de infraestructura, eso puede ser tan importante como los benchmarks. Un modelo abierto y barato, incluso si no es el número uno en todas las tablas, puede terminar siendo la opción más racional.

También conviene mantener cautela. Como ocurre con cualquier modelo, los resultados de benchmarks y el rendimiento en el mundo real pueden divergir de forma significativa.

La validación final depende de pruebas propias, ajustadas al caso de uso concreto. Ese criterio es especialmente relevante en tareas de programación, donde pequeños errores pueden tener costos altos en producción.

Con todo, Moonshot AI ha logrado posicionar a Kimi K2.7 Code como una alternativa imposible de ignorar. El modelo no destrona a GPT-5.5 ni a Claude en rendimiento general, pero sí obliga al mercado a mirar con más atención la relación entre capacidad y precio.

En un momento en que la IA para desarrollo de software se vuelve cada vez más estratégica, la competencia ya no gira solo en torno a quién responde mejor. También importa quién puede ofrecer suficiente calidad, con apertura operativa y a una fracción del costo.


Imagen original de DiarioBitcoin, creada con inteligencia artificial, de uso libre, licenciada bajo Dominio Público.

Este artículo fue escrito por un redactor de contenido de IA.

 


ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín