El laboratorio chino MiniMax presentó el 1 de junio de 2026 su modelo insignia MiniMax M3, un gran modelo de lenguaje de pesos abiertos que se descarga y se puede alojar en servidores propios. La combinación que ofrece es difícil de ignorar: capacidad de programación cercana a la frontera, una ventana de contexto de hasta un millón de tokens, multimodalidad nativa y una API muy barata.
El movimiento encaja en una tendencia clara: la alternativa abierta y económica de origen chino frente a la IA cerrada estadounidense. M3 quiere competir de tú a tú con GPT-5.5 y con Claude Opus, pero permitiendo que cualquiera baje los pesos desde Hugging Face o GitHub y los ejecute por su cuenta, sin depender de una nube ajena.
Conviene matizar desde el principio: según los propios benchmarks de MiniMax, M3 se acerca a esos rivales pero no los supera, y todas las cifras de rendimiento las publica el fabricante sin verificación independiente. Aun así, el conjunto de prestaciones lo convierte en uno de los lanzamientos abiertos más relevantes del año.
Qué es MiniMax M3 y qué ofrece
MiniMax M3 es el modelo de lenguaje insignia de MiniMax, lanzado el 1 de junio de 2026. Sobre el papel sus números son ambiciosos:
- Arquitectura Mixture-of-Experts (MoE): alrededor de 428.000 millones de parámetros totales, pero solo unos 23.000 millones activos por token. Eso permite el tamaño y la capacidad de un modelo enorme con un coste de cálculo por token mucho más contenido.
- Ventana de contexto de hasta 1.000.000 de tokens: suficiente para tragar bases de código completas, libros enteros o conversaciones larguísimas de una sola vez. La API garantiza al menos 512K tokens.
- Multimodalidad nativa: no es un añadido posterior. M3 se entrenó desde el principio para aceptar imágenes y vídeo como entrada, e incluso puede operar un ordenador de escritorio de forma agéntica.
El otro gran rasgo es la apertura, aunque con un matiz importante. Los pesos y el código son públicos en Hugging Face y GitHub, así que cualquiera puede descargarlos y alojarlos por su cuenta.
Abierto, pero no del todo. M3 se distribuye bajo la “MiniMax Community License”. Los pesos son descargables y autoalojables, pero la licencia impone condiciones para el uso comercial. Es, por tanto, un modelo de pesos abiertos (open-weights), no software totalmente libre ni una licencia permisiva tipo MIT. La distinción importa si piensas montar un producto encima.
La gran baza: velocidad y precio
Si algo distingue a M3 frente a su predecesor es un nuevo método de atención llamado MiniMax Sparse Attention (MSA). Es la pieza técnica que hace viable trabajar con un millón de tokens sin que el coste se dispare.
Comparado con el anterior modelo M2 trabajando con contexto de 1M de tokens, MiniMax reporta mejoras notables:
| Métrica | Mejora frente a M2 (a 1M tokens) |
| Prefill (procesar la entrada) | más de 9× más rápido |
| Decode (generar la respuesta) | más de 15× más rápido |
| Cómputo por token | aproximadamente 1/20 |
En la práctica, eso significa contextos gigantes a un coste por token mucho menor, que es justo donde los modelos cerrados suelen encarecerse.
Esa eficiencia se traslada al precio de la API, que es uno de los argumentos más fuertes del lanzamiento:
- Entrada: unos 0,30 dólares por millón de tokens.
- Salida: unos 1,20 dólares por millón de tokens.
- En el estreno hubo una promoción temporal a 0,60 / 2,40 dólares.
Para quien prefiera tarifa plana, hay suscripciones de Plus a 20 $/mes, Max a 50 $/mes y Ultra a 120 $/mes.
Y por encima de todo está la opción de no pagar API en absoluto: al ser de pesos abiertos, una empresa con hardware suficiente puede descargar M3 y ejecutarlo en su propia infraestructura, manteniendo los datos en casa. Esa combinación de precio bajo, autoalojamiento y contexto de un millón de tokens es lo que convierte a M3 en una alternativa seria a la IA cerrada estadounidense.
¿Está al nivel de GPT-5.5 y Claude? La verdad de los benchmarks
Aquí toca ser honestos. MiniMax acompaña el lanzamiento de varias cifras llamativas, pero todas son autorreportadas por el fabricante y, de momento, no hay verificación independiente.
Entre los resultados que publica la propia MiniMax:
- SWE-Bench Pro: 59%.
- Terminal-Bench 2.1: 66%.
- PostTrainBench: M3 obtiene 0,37, frente a 0,39 de GPT-5.5 y 0,42 de Claude Opus 4.7.
Ese último dato es el más revelador y conviene leerlo con calma: en el propio benchmark de MiniMax, M3 queda ligeramente por debajo de GPT-5.5 y de Claude Opus 4.7. Es decir, se acerca a la frontera y rivaliza con los grandes modelos cerrados, pero no los supera. Cualquier titular que afirme lo contrario está exagerando.
Además, la frontera no se queda quieta. Mientras se mide M3 contra Opus 4.7, Anthropic ya ha lanzado un Opus 4.8 más reciente, de modo que el listón se mueve constantemente y el “casi puntero” de hoy es un objetivo en movimiento.
¿Qué significa esto para ti? Si buscas el máximo rendimiento bruto, los modelos cerrados de referencia siguen ligeramente por delante según estas cifras. Pero si valoras un coste muy bajo, una ventana de contexto de un millón de tokens, multimodalidad nativa y la posibilidad de autoalojar el modelo con tus propios datos, M3 ofrece una relación prestaciones-precio difícil de igualar. La clave estará en esperar a pruebas independientes que confirmen los números del fabricante.











