MiniMax M3 se abre al mundo y acelera su respuesta en la carrera global de IA

𝕏

Hace 38 segundos

Por Canuto

MiniMax, una de las firmas chinas más visibles en inteligencia artificial, anunció la apertura oficial de su modelo multimodal insignia MiniMax M3, una plataforma que combina gran escala, entrenamiento multimodal desde la etapa inicial y un fuerte enfoque en generación de código utilizable. La empresa también reportó que elevó la velocidad de respuesta del sistema de 30 TPS a 80 TPS tras los retrasos causados por la demanda inicial.
***

MiniMax abrió oficialmente MiniMax M3, su modelo multimodal nativo insignia de 428.000 millones de parámetros.
La compañía afirmó que la velocidad de salida del modelo pasó de 30 TPS a 80 TPS tras optimizaciones iniciales.
Según la empresa, M3 destacó en pruebas de codificación y agentes inteligentes, con énfasis en código directamente entregable.

MiniMax, una compañía tecnológica reconocida dentro del sector de inteligencia artificial en China, anunció la apertura oficial de su modelo multimodal nativo insignia, MiniMax M3. La decisión marca un nuevo paso dentro de la competencia global por modelos abiertos de alto rendimiento.

El anuncio llega después de que el equipo ya hubiera liberado los pesos del modelo a la industria. De forma paralela, también publicó un artículo técnico detallado sobre su mecanismo de atención dispersa, un punto que, según la propia empresa, atrajo amplia atención de la comunidad de código abierto.

La apertura de modelos avanzados se ha convertido en una pieza estratégica dentro del ecosistema de IA. No solo define quién lidera en investigación aplicada, sino también qué empresas logran atraer desarrolladores, startups y socios empresariales a sus plataformas.

En ese contexto, MiniMax busca posicionar a M3 como una referencia entre los modelos abiertos de nueva generación. La firma sostiene que su arquitectura y su forma de entrenamiento lo diferencian de otras propuestas disponibles en el mercado.

Para lectores menos familiarizados con el sector, un modelo multimodal es un sistema capaz de procesar y generar distintos tipos de información, como texto, imágenes y otras señales. Esa capacidad amplía su utilidad en programación, automatización, asistentes digitales y aplicaciones empresariales complejas.

Un modelo de gran escala con enfoque multimodal desde el inicio

De acuerdo con la información divulgada, MiniMax M3 tiene un total de 428.000 millones de parámetros. De esa cifra, 23.000 millones corresponden a parámetros activos.

La empresa afirmó además que M3 es el primer gran modelo de código abierto de la industria que realiza entrenamiento multimodal mixto directamente desde la etapa inicial del proceso de formación. Ese punto es relevante porque muchas arquitecturas integran modalidades distintas en fases posteriores.

El entrenamiento multimodal temprano puede influir en la forma en que el sistema relaciona texto, imágenes y otras entradas. En teoría, esto favorece una comprensión más integrada y una ejecución más consistente en tareas que requieren combinar diferentes fuentes de información.

MiniMax presentó esa característica como una de las razones detrás del desempeño de M3. La empresa indicó que, gracias a su arquitectura técnica, el modelo alcanzó la posición superior entre los sistemas de código abierto en un índice autorizado de inteligencia global integral apenas dos semanas después de su lanzamiento.

La fuente no detalló en su nota el nombre específico de ese índice ni la metodología usada para medir el liderazgo mencionado. Aun así, la referencia ilustra cómo la firma quiere enmarcar el debut de M3 dentro de una narrativa de avance acelerado frente a otros proyectos abiertos.

La publicación del artículo técnico sobre atención dispersa también sugiere un esfuerzo por mostrar no solo resultados, sino fundamentos de diseño. En la práctica, este tipo de materiales suele ser clave para ganar legitimidad entre investigadores y desarrolladores que evalúan arquitectura, eficiencia y escalabilidad.

Del retraso inicial a una salida de 80 TPS

Uno de los datos más concretos del anuncio fue la mejora en la velocidad de salida del modelo. Según MiniMax, la primera oleada de tráfico provocó retrasos en la experiencia de uso poco después del lanzamiento.

Como respuesta, el equipo oficial optimizó el sistema para elevar la velocidad de salida desde 30 TPS hasta 80 TPS. La empresa añadió que prevé nuevas mejoras en el futuro.

En este caso, TPS se refiere a tokens por segundo, una métrica común dentro de los modelos generativos. Aunque no resume por sí sola toda la calidad de un sistema, sí influye de forma directa en la percepción del usuario, en especial cuando se trata de asistentes conversacionales o herramientas de programación.

Una mejora de esa magnitud resulta importante para escenarios donde la rapidez afecta productividad y costos operativos. También puede ser un factor competitivo frente a otros modelos abiertos que compiten por adopción en empresas y comunidades técnicas.

La mención de los cuellos de botella iniciales deja ver otro rasgo del mercado actual de IA. Cuando un modelo capta atención inmediata, la infraestructura y la inferencia se vuelven tan relevantes como el entrenamiento original.

Para una empresa que busca liderar en código abierto, sostener el interés depende tanto de rendimiento bruto como de disponibilidad real. En otras palabras, una arquitectura prometedora necesita responder con velocidad suficiente para evitar frustración entre quienes la prueban o integran en productos.

Codificación avanzada y agentes con múltiples herramientas

MiniMax también puso énfasis en las capacidades de codificación de M3. La empresa aseguró que, en varias evaluaciones de alta dificultad sobre programación y agentes inteligentes, el modelo mostró estándares técnicos líderes en la industria.

Entre las facultades destacadas, la firma señaló que M3 puede descomponer tareas complejas de manera autónoma. Además, indicó que el sistema es capaz de utilizar diversas herramientas externas para ejecutar razonamiento de múltiples pasos.

Esa combinación es especialmente relevante en la evolución reciente de la IA generativa. El mercado ha pasado de valorar solo respuestas textuales fluidas a exigir sistemas que planifiquen, usen herramientas y mantengan coherencia en cadenas de acciones más largas.

En programación, ese cambio implica mucho más que autocompletar funciones o corregir errores simples. Los usuarios corporativos y los equipos de desarrollo esperan asistentes que entiendan objetivos, organicen subtareas y entreguen resultados listos para revisión o despliegue.

MiniMax sostuvo que M3 ya representa un salto cualitativo frente a modelos tradicionales en escritura de código. La formulación elegida por la empresa apuntó a una diferencia práctica, no solo a una mejora marginal en pruebas técnicas.

Según el equipo oficial, el código generado por M3 está pensado para cumplir estándares directamente entregables. En su descripción, eso lo separa de sistemas que apenas producen una base funcional pero todavía exigen amplias modificaciones manuales.

Qué puede significar para desarrolladores y para la industria

Si esa promesa se sostiene en uso real, el impacto potencial sobre la productividad de desarrolladores sería considerable. Reducir tiempo de corrección, integración y revisión puede traducirse en ciclos de trabajo más cortos y en menores costos para equipos técnicos.

La apertura del modelo también tiene un valor estratégico más amplio. En el terreno del código abierto, liberar pesos y documentación no solo aumenta visibilidad, sino que crea las condiciones para auditoría, adaptación y experimentación por parte de terceros.

Para China, además, el movimiento encaja con la creciente proyección de sus empresas de IA en el escenario internacional. Cada lanzamiento de alto nivel eleva la presión competitiva sobre firmas de Estados Unidos, Europa y otros polos tecnológicos que pugnan por influencia en la próxima capa de infraestructura digital.

También conviene matizar el anuncio con una lectura prudente. Las afirmaciones de liderazgo en benchmarks y de calidad de código entregable suelen requerir validación independiente, sobre todo cuando se evalúan casos de uso empresariales, seguridad, robustez y mantenimiento a gran escala.

Aun con esa cautela, el anuncio de MiniMax refuerza una tendencia clara en la industria. Los modelos abiertos ya no compiten solo por ser accesibles, sino por acercarse al nivel de desempeño, velocidad y utilidad comercial que antes parecía reservado a plataformas cerradas.

Según informó Aibase, el lanzamiento abierto de M3 y la mejora de 30 TPS a 80 TPS forman parte de una ofensiva más amplia de MiniMax por consolidarse en la primera línea de la IA multimodal. Lo que siga dependerá de la adopción de desarrolladores, la evaluación de la comunidad técnica y la capacidad de la empresa para sostener futuras optimizaciones.

ADVERTENCIA: DiarioBitcoin ofrece contenido informativo y educativo sobre diversos temas, incluyendo criptomonedas, IA, tecnología y regulaciones. No brindamos asesoramiento financiero. Las inversiones en criptoactivos son de alto riesgo y pueden no ser adecuadas para todos. Investigue, consulte a un experto y verifique la legislación aplicable antes de invertir. Podría perder todo su capital.

Suscríbete a nuestro boletín

𝕏

USDT	Tether USDt	0,0%	$63,3 mmd
BTC	Bitcoin	-2,58%	$29,58 mmd
ETH	Ethereum	-3,05%	$11,91 mmd
USDC	USDC	0,02%	$10,06 mmd
SOL	Solana	-4,19%	$2,4 mmd
XRP	XRP	-3,86%	$1,82 mmd
USD1	World Liberty Financial USD	0,0%	$1,74 mmd
HYPE	Hyperliquid	-7,31%	$1,08 mmd
BNB	BNB	-2,96%	$1,04 mmd
XLM	Stellar	-8,74%	$0,640 984 mmd

DEXE	DeXe	13,61%	$16,47
BEAT	Audiera	10,04%	$1,7
POL	Polygon (prev. MATIC)	1,34%	$0,077 372
NIGHT	Midnight	1,12%	$0,030 833
SKY	Sky	1,07%	$0,058 14
JTO	Jito	0,86%	$0,712 526
TRX	TRON	0,12%	$0,321 345
FDUSD	First Digital USD	0,05%	$0,998 181
U	United Stables	0,02%	$1,0
USDC	USDC	0,02%	$0,999 858

H	Humanity	-18,83%	$0,200 724
SPX	SPX6900	-10,88%	$0,356 875
AVAX	Avalanche	-9,32%	$6,01
ALGO	Algorand	-9,14%	$0,091 335
XLM	Stellar	-8,74%	$0,217 772
PUMP	Pump.fun	-8,35%	$0,001 365
ENA	Ethena	-8,14%	$0,086 45
ASTER	Aster	-8,04%	$0,620 481
LIT	Lighter	-7,42%	$1,52
HYPE	Hyperliquid	-7,31%	$66,74

MiniMax M3 se abre al mundo y acelera su respuesta en la carrera global de IA

Un modelo de gran escala con enfoque multimodal desde el inicio

Del retraso inicial a una salida de 80 TPS

Codificación avanzada y agentes con múltiples herramientas

Qué puede significar para desarrolladores y para la industria

Suscríbete a nuestro boletín

Artículos Relacionados

Microsoft suena las alarmas sobre malware que roba billeteras cripto por USB

Amazon quiere vender chips Trainium y desafiar más de cerca el dominio de Nvidia en IA

EE. UU. sospecha que una máquina EUV de ASML llegó a China y la empresa lo niega

Noam Shazeer deja Google y se une a OpenAI en plena carrera hacia su IPO