Z.ai lanza GLM-5.2: 1 millón de tokens, código abierto (MIT) y sin benchmarks… que días después arrasaron

Rubén Castro, 16 junio 2026
z ai glm 5 2 ia china codigo abierto z ai glm 5 2 ia china codigo abierto

El laboratorio chino Z.ai (antes conocido como Zhipu AI) lanzó alrededor del 13 de junio de 2026 su nuevo modelo de lenguaje GLM-5.2, orientado de forma muy clara a la programación y la generación de código. La novedad más llamativa es su ventana de contexto de un millón de tokens, cinco veces mayor que la de su predecesor GLM-5.1, lo que le permite mantener proyectos enteros «en la cabeza» durante una misma conversación.

Pero el modelo también ha dado que hablar por la forma en que se presentó. Z.ai publicó primero la disponibilidad, el contexto ampliado y, sobre todo, sus pesos abiertos bajo licencia MIT, sin acompañar el anuncio de una sola cifra oficial de rendimiento. Pocos días después, las pruebas independientes situaban a GLM-5.2 a la cabeza de todos los modelos de pesos abiertos.

En este artículo repasamos qué trae GLM-5.2 de nuevo, por qué su lanzamiento sin benchmarks resultó tan inusual y cómo puede usarse desde Europa, con su precio y la nota imprescindible sobre privacidad para quienes manejan datos sensibles.

Qué es GLM-5.2 y qué trae de nuevo

GLM-5.2 es un modelo de lenguaje grande (LLM) centrado en programación y tareas de código. Su gran salto frente a GLM-5.1 está en la ventana de contexto: pasa de los aproximadamente 200.000 tokens a un millón de tokens, un aumento de cinco veces que le permite trabajar con bases de código completas o documentación extensa sin perder el hilo. La respuesta máxima por turno llega hasta unos 131.072 tokens.

La otra novedad de uso diario son los dos niveles seleccionables de «esfuerzo de razonamiento»:

  • High: el modo equilibrado y más rápido, pensado para la mayoría de tareas.
  • Max: razonamiento extendido paso a paso, orientado a problemas de programación complejos y de varios pasos.

Bajo el capó, GLM-5.2 mantiene una arquitectura Mixture-of-Experts de 744.000 millones de parámetros, de los que solo se activan unos 40.000 millones por token. Es el mismo tronco de la familia GLM-5/5.1: las mejoras no llegan por sumar parámetros, sino por el entrenamiento, el manejo del contexto y el nuevo marco de razonamiento.

Pesos abiertos bajo licencia MIT. Z.ai publicó GLM-5.2 con sus pesos abiertos en Hugging Face (cuenta zai-org). La licencia MIT permite descargarlo, ajustarlo (fine-tuning) y alojarlo por cuenta propia de forma totalmente gratuita, algo poco habitual en un modelo de este nivel.

El lanzamiento más raro: sin benchmarks… y luego, líder de los abiertos

Lo más insólito del estreno fue lo que faltaba. Z.ai apostó por sacar primero la disponibilidad, el contexto de un millón de tokens y el plan de código abierto, y no publicó ninguna puntuación oficial de benchmark en el momento del lanzamiento. En un sector donde los anuncios suelen abrir con tablas comparativas, la decisión llamó la atención.

El silencio duró poco. En torno a tres o cuatro días después, llegaron las pruebas independientes. Según la consultora independiente Artificial Analysis, en su Intelligence Index (v4.1) GLM-5.2 obtuvo una puntuación de 51, situándose por delante de todos los modelos de pesos abiertos, incluidos MiniMax-M3 y DeepSeek V4 Pro, ambos con 44.

Conviene subrayar que esas cifras son de terceros, no afirmaciones oficiales de Z.ai en el lanzamiento. Aun así, el arco resultante es difícil de ignorar: el modelo salió sin números y, pocos días más tarde, lideraba el ranking de los abiertos.

A ese contexto se suma un detalle de fondo sobre la procedencia del proyecto. Z.ai es un laboratorio chino surgido como spin-off de la Universidad de Tsinghua, fundado en 2019, que salió a bolsa en Hong Kong en enero de 2026. Su anterior GLM-5 se entrenó, según se ha informado, enteramente sobre unos 100.000 chips Huawei Ascend, sin hardware de NVIDIA, un dato que da idea de la madurez de la alternativa china en infraestructura de IA.

Precio, cómo usarlo y la nota para Europa

Uno de los mayores atractivos de GLM-5.2 es su coste. Por API ronda los 1,40 dólares por millón de tokens de entrada y los 4,40 dólares por millón de tokens de salida, aproximadamente una sexta parte del precio de GPT-5.5 y en torno a una décima parte del nivel más alto de Claude. Para quienes prefieren tarifa plana, existe además el GLM Coding Plan en tres niveles:

PlanPrecio
Lite10 $/mes
Pro30 $/mes
Max80 $/mes

En cuanto a cómo usarlo, desde el primer día está disponible a través de un endpoint compatible con la API de Anthropic, lo que permite emplearlo en herramientas de programación como Claude Code o Cline simplemente cambiando la URL base y el modelo. También llegó listo en Cloudflare Workers AI y en OpenRouter, además del chat web en chat.z.ai.

La nota para Europa. GLM-5.2 es perfectamente utilizable desde el continente, tanto por web como por API. Ahora bien, la API directa se ejecuta sobre infraestructura china y estadounidense, así que para datos sensibles bajo el RGPD la opción limpia es autoalojar los pesos abiertos, que la licencia MIT permite sin coste.

Entre el contexto de un millón de tokens, los pesos abiertos y un precio muy por debajo de los grandes rivales, GLM-5.2 se perfila como una de las opciones más interesantes del momento para quien programa con ayuda de IA.

Rubén Castro

Rubén Castro

Redactor

Apasionado de explorar y diseccionar lo último en tecnología. Tengo mucha experiencia en el mundo de los ordenadores y el gaming, aunque también me gustan todos los tipos de gadgets.