Por qué OpenAI y Anthropic no pueden permitirse que uses la IA a tope

Rubén Castro, 15 junio 2026
coste real suscripciones ia openai anthropic coste real suscripciones ia openai anthropic

La promesa de la IA generativa choca con una realidad incómoda: cuanto más la usas, más dinero pierden las empresas que están detrás. Un análisis de la firma SemiAnalysis ha puesto cifras a esa paradoja y ha reavivado el debate sobre lo insostenible que resulta hoy el modelo de suscripción plana.

El dato que más ha llamado la atención: una cuota «ilimitada» de 200 $ al mes —como ChatGPT Pro o Claude Max— podría llegar a costarle a OpenAI hasta unos 14.000 $ (y a Anthropic, unos 8.000 $) en cómputo si un usuario exprimiera de verdad su límite. Son estimaciones del propio SemiAnalysis, no cifras oficiales de las compañías, pero ilustran muy bien por qué OpenAI y Anthropic, en la práctica, no pueden permitirse que todo el mundo use la IA a tope.

Vamos a ver por qué la inferencia sale tan cara, por qué los números no salen y qué significa todo esto para ti, que probablemente ya estás notando topes de uso y cambios de precio.

Por qué la inferencia cuesta tanto

Cada vez que escribes a un chatbot, el modelo se ejecuta en GPUs carísimas, y esa factura la paga la empresa. Mientras la suscripción es plana (pagas lo mismo uses lo que uses), el coste crece con cada token. Y el problema se dispara con las nuevas herramientas agénticas y de programación: según SemiAnalysis, un sistema agéntico puede consumir hasta 1.000 veces más tokens que una consulta normal, porque encadena de forma autónoma muchísimas llamadas al modelo.

A eso se suma el modelo de subvención: para ganar cuota de mercado, las empresas fijaron precios artificialmente bajos, quemando capital de los inversores. SemiAnalysis calcula —asumiendo márgenes del 75 % en el precio de su API— que Anthropic llega al equilibrio en torno al 20 % de uso de la cuota en sus planes más bajos, mientras que OpenAI empieza a perder dinero en cuanto se supera el 11 % de uso en algunos de los suyos. En los planes tope, el umbral es aún más bajo.

¿Qué es la «inferencia»? Es el proceso de usar un modelo ya entrenado para responder. Entrenar el modelo es un gasto puntual y enorme; la inferencia es el gasto recurrente, el que se repite con cada mensaje. Por eso, cuando una herramienta encadena miles de pasos sin que tú lo veas, la factura se multiplica.

Los números no salen

Cuando el uso se dispara, los márgenes se vuelven profundamente negativos. En el peor de los casos —un usuario que aprovecha al máximo el plan más caro— SemiAnalysis estima márgenes de en torno al −900 % en el Claude Max de 20× y de hasta cerca del −1.650 % en el plan tope de OpenAI. Dicho de otro modo: por cada euro que ingresan, pueden llegar a gastar varias veces esa cantidad.

Y el problema no es solo teórico. Según un reportaje de Axios, una empresa (sin identificar) llegó a gastar unos 500 millones de dólares en Claude en un solo mes por no poner ningún límite a las licencias de sus empleados, que usaban la IA premium hasta para tonterías como «consultar el tiempo». En la misma línea, se ha contado que Uber agotó en abril el presupuesto anual de una de sus herramientas de IA para programar.

Conviene tomar estas cifras con cautela: los porcentajes y los 14.000 $ son estimaciones de SemiAnalysis bajo unos supuestos concretos, y el caso de los 500 millones procede de una sola fuente. Aun así, la dirección es clara, y la reconocía ya el propio Sam Altman a principios de 2025: «estamos perdiendo dinero» con las suscripciones Pro porque «la gente las usa mucho más de lo que esperábamos».

Qué significa para ti (y la fuga a los modelos chinos)

Si todo esto te suena, es porque ya lo estás viviendo. La respuesta de las empresas a esta sangría se traduce en cosas muy concretas para el usuario:

  • Límites de uso semanales y cuotas cada vez más ajustadas.
  • Ralentizaciones en horas punta y degradación del servicio cuando hay saturación.
  • El desplazamiento de los modelos más potentes hacia el pago por consumo (por tokens) en lugar de la tarifa plana.
  • Facturación aparte para los agentes autónomos, que son los que más recursos devoran.

Hay además un efecto secundario interesante: muchas empresas están migrando a modelos chinos mucho más baratos. El CEO de Lindy, Flo Crivello, aseguró haber movido el 100 % de su tráfico a DeepSeek V4, ahorrando «millones» con un rendimiento similar en muchas tareas. En un ejemplo citado, una misma carga de trabajo costaba 1.071 $ en DeepSeek frente a 4.811 $ en Claude Opus: más de cuatro veces menos.

La conclusión es que la era de la IA «ilimitada» por una cuota fija tiene los días contados. El propio SemiAnalysis prevé que los modelos intermedios sí podrán ofrecerse con beneficio por unos 20 $ al mes, pero la potencia de primera línea irá camino del pago por uso. Puedes consultar los planes y precios actuales en la página oficial de precios de ChatGPT.

Rubén Castro

Rubén Castro

Redactor

Apasionado de explorar y diseccionar lo último en tecnología. Tengo mucha experiencia en el mundo de los ordenadores y el gaming, aunque también me gustan todos los tipos de gadgets.