Por qué las suscripciones de IA están a punto de comoditizarse

Estaba sentado en mi escritorio un martes, mirando cuatro paneles de facturación AI diferentes abiertos en cuatro pestañas diferentes, y me di cuenta de que me había convertido exactamente en el cliente para el cual la industria AI fue creada para monetizar.

Claude Max, $100. Codex Plus, $20. Una clave DeepSeek API con alrededor de $20 de crédito. Una cuenta OpenRouter con otros $15. Una prueba de Kimi K2.6 ejecutada a través de OpenCode que había olvidado todavía estaba activa. Lo sumé y el número me hizo sentir incómodo de una manera que aún no entendía del todo, no porque fuera mucho dinero, sino porque por primera vez en dos años realmente no podía decirte cuál de esas suscripciones necesitaba.

Eso es lo que pasa con la mercantilización de la suscripción AI. No se anuncia. No se presenta como una guerra de precios ni como un evento de lanzamiento dramático. Se muestra como una sospecha lenta y creciente de que aquello por lo que has estado pagando en la parte superior de la pila no es en realidad lo que crea el valor en la parte inferior de la pila. Y si eso es cierto (si el modelo en sí se está convirtiendo en una mercancía mientras la capa de aplicación se come todo el margen), entonces la pila de suscripciones que he pasado dos años construyendo podría estar resolviendo un problema que está a punto de dejar de existir.

Voy a explicarles lo que realmente pago, lo que realmente obtengo, por qué creo que los modelos de peso abierto han cerrado la brecha lo suficientemente rápido como para romper el modelo de precios que financia los laboratorios fronterizos, y hacia dónde creo que se están moviendo los verdaderos fosos. Algo de esto se leerá como una herejía si estás inmerso en el ecosistema Claude o OpenAI. Yo también lo soy. Por eso lo estoy escribiendo.

La pila por la que realmente estoy pagando

Déjame exponerlo para que trabajemos con los mismos números.

Pago $100 al mes por Claude Max 5x, lo que me da aproximadamente 225 mensajes cada cinco horas en Sonnet 4.7 y un sobre mucho más pequeño en Opus 4.7. Ese es el plan que utilizo para el trabajo de diseño avanzado, la escritura de formato largo y los proyectos en los que quiero el perfil de gusto específico de Opus en el resultado. Hay un nivel Max 20x a $ 200 que activé dos veces y lo desactivé en ambas ocasiones porque no podía justificar el gasto en un estado estable.

Pago $20 al mes por ChatGPT Plus, lo que me permite ingresar a Codex con el modelo GPT-5.5 y, hasta el 31 de mayo de 2026, un aumento temporal de 25x en los límites de Codex de 5 horas que vuelve a caer a 5x una vez que finaliza la promoción. Ese es el plan que utilizo para el código backend, canalizaciones de datos, andamios de aprendizaje automático y el tipo de trabajo rutinario donde la eficiencia de GPT-5.5 es realmente medible. Cubrí el enfrentamiento en detalle cuando escribí sobre Codex versus Claude Code, y la brecha que mencioné solo se ha ampliado desde entonces.

Luego está el elenco giratorio de teclas API. DeepSeek, actualmente en V4 Pro a un precio promocional con grandes descuentos hasta el 31 de mayo. Kimi K2.6 a OpenRouter a $0,60 por millón de tokens de entrada y $2,50 por millón de salida. Un puñado de modelos gratuitos en OpenRouter que tienen una velocidad limitada a veinte solicitudes por minuto pero que funcionan bien para trabajos por lotes que no son urgentes. Los mantengo en parte como respaldo para cuando Anthropic o OpenAI lleguen a un incidente en la página de estado, y en parte porque estoy realizando suficientes experimentos por mes como para usarlos.

El daño total, antes del gasto simbólico, está entre $135 y $160 por mes, dependiendo de lo que he estado probando. Agregue el uso de API y un mes típico oscila entre $ 200 y $ 280. Ese es el número en la hoja de cálculo que estaba mirando el martes.

Esto es lo que noté cuando profundicé en el desglose: las suscripciones propietarias representaron aproximadamente el 78% del costo y aproximadamente el 60% de los tokens de razonamiento reales que usé ese mes. No el 60% del valor, sino el 60% de los tokens. Las cosas baratas llevaban más carga de la que había supuesto.

Ese es el momento en que la pregunta dejó de ser "¿cómo optimizo mi pila AI?" y comencé a preguntarme "¿para qué estoy pagando realmente estas suscripciones de primer nivel?"

El problema de ponerse al día

Para entender por qué es importante la pregunta, hay que observar dónde están ahora los modelos de peso abierto en comparación con dónde estaban hace un año.

En mayo de 2025, la conversación fue sencilla. Claude y GPT eran la frontera. Los modelos de peso abierto como Mistral y los primeros lanzamientos de Qwen y DeepSeek se estaban poniendo al día en puntos de referencia específicos, pero estaban perdiendo mucho en el trabajo que importaba: razonamiento de contexto prolongado, uso de herramientas agentes, el tipo de tareas de ingeniería de varios pasos que interesan a los desarrolladores reales. Pagar $100 al mes por Claude era una obviedad porque la siguiente mejor alternativa no era realmente una alternativa.

Esa brecha no sólo se redujo en 2026. En varios puntos de referencia específicos, se cerró por completo.

Clasificación de análisis artificial DeepSeek V4 Pro en el puesto 52 en el índice de inteligencia, el modelo de razonamiento de peso abierto número 2, detrás de Kimi K2.6, y el modelo cuesta aproximadamente $1,071 para ejecutar el conjunto de referencia completo versus $4,811 para Claude Opus 4.7. Esa es una diferencia de costos de 4,5 veces en una comparación directa de inteligencia. En SWE-Bench Verified, la evaluación de codificación más citada de la tabla de clasificación, DeepSeek V4 Pro Max obtiene una puntuación del 80,6%, Kimi K2.6 alcanza el 80,2% y MiniMax M2.5 llega al 80,2%, todo dentro de un punto porcentual del 80,8% de Claude Opus 4.6. HumanEval está efectivamente saturado en este punto; Kimi K2.5 lideró con un 99,0% antes de que el índice de referencia dejara de discriminar significativamente entre los mejores modelos.

Lea esos números con atención. Los modelos de peso abierto no superan a los modelos propietarios. Los están igualando en los puntos de referencia para los que los modelos patentados fueron diseñados específicamente para ganar, a una fracción del costo. Y la cuestión de los costes es la parte que realmente es desestabilizadora.

DeepSeek V3.2 recortó su precio de API a la mitad a finales de 2025 a 0,028 dólares por millón de tokens de entrada de caché y 0,42 dólares por millón de salida. V4 Pro actualmente tiene un descuento promocional del 75% hasta el 31 de mayo de 2026. Kimi K2.6 tiene una entrada de $0,60 y una salida de $2,50. A modo de comparación, Claude Opus 4.7 es aproximadamente entre 8 y 10 veces más caro en tokens de salida que Kimi, y aproximadamente 30 veces más caro que DeepSeek V4 en entrada. Una carga de trabajo SaaS que procesa 100 millones de tokens al mes, algo que no es inusual para una aplicación agente, paga alrededor de $310 con Kimi versus $4,000+ con GPT-5.4 u Opus 4.7.

Este es el ciclo del huevo y la gallina del que nadie en la cima quiere hablar. Los laboratorios fronterizos entrenan un modelo nuevo y costoso. Cobran una prima por ello porque tienen que recuperar el coste de la formación y financiar la próxima generación. Los laboratorios de peso abierto aplican ingeniería inversa a las técnicas, envían un modelo que tiene entre un 90% y un 95% de capacidad al precio 1/10th y el mercado se encamina en consecuencia. Para cuando el laboratorio propietario anuncia la versión N+1, el modelo de peso abierto ya tiene un precio que hace desaparecer la mayor parte de las oportunidades de ingresos de la generación anterior.

Esa no es una tendencia de cinco años. Ese es el ciclo en el que ya estamos dentro.

La analogía de Android iOS y por qué falla

La analogía más clara que he escuchado sobre lo que está sucediendo es la dinámica de Android versus iOS de la década de 2010. El AI patentado es iOS: controlado, pulido, integrado verticalmente y costoso. El AI de peso abierto es Android: flexible, modificable, fragmentado y económico. iOS tuvo una prima durante una década porque la integración de hardware y software de Apple creó un bloqueo que la apertura de Android no pudo replicar con el mismo nivel de calidad.

La analogía funciona, hasta que notas la parte donde se rompe por completo.

El foso de iOS de Apple era el hardware. No se podía ejecutar iOS en un teléfono Samsung. La integración vertical que hizo que el iPhone fuera premium estaba protegida literalmente por los chips físicos del dispositivo. Apple controlaba Photonic Engine, Neural Engine, Secure Enclave, y ese bloqueo del hardware es lo que mantuvo intacto el poder de fijación de precios de la plataforma durante quince años.

No existe un foso equivalente en la inferencia AI.

Un modelo Kimi K2.6 que se ejecuta en una Nvidia H200 en un centro de datos de Singapur produce tokens que son funcionalmente idénticos a un modelo Kimi K2.6 que se ejecuta en un Huawei Ascend 950PR en Shenzhen, que son funcionalmente idénticos a un modelo Kimi K2.6 que se ejecuta en cualquier clúster OpenRouter que enrute la solicitud hasta ese día. El "hardware" es fungible. El "sistema operativo" (los pesos del modelo) se puede descargar. La "tienda de aplicaciones", la puerta de enlace API, está siendo mercantilizada por servicios como OpenRouter que agregan docenas de proveedores detrás de una sola clave.

Si Apple se hubiera visto obligada a enviar iOS como un ISO descargable que se ejecutara en cualquier teléfono con las especificaciones correctas, iOS se habría visto muy diferente en 2015. Esa es la posición en la que se encuentran hoy los laboratorios propietarios AI. Lo que están tratando de cobrar una prima puede ser replicado por un competidor con $5,6 millones en computación, y el modelo resultante puede ser servido por cualquier persona con una GPU y un terminal API.

Es por eso que la analogía que uso ahora no es iOS versus Android. Es Apple contra todos en el mercado de portátiles de finales de la década de 2000. Apple todavía fabricaba máquinas hermosas. Apple todavía tenía una prima. Pero en el momento en que los componentes subyacentes (los chips, las pantallas, los sistemas operativos) estuvieron ampliamente disponibles para otros fabricantes, la participación de mercado de Apple cayó a un solo dígito y permaneció allí durante una década. Apple sobrevivió no gracias al hardware, sino gracias al ecosistema de aplicaciones, las herramientas de desarrollo, el lenguaje de diseño y la historia de la marca. El hardware se convirtió en algo en juego.

Hacia allí se dirigen los laboratorios AI. El modelo se está convirtiendo en algo en juego. La pregunta es qué queda después de eso.

¿Dónde creo que están los verdaderos fosos?

Esta es la parte en la que he estado pensando durante semanas, porque determina lo que sobrevive a la transición.

Veo que se están formando cuatro fosos reales, y sólo uno de ellos es por lo que estoy pagando actualmente.

El primer foso es la capa de aplicación. Este es Claude Code. Este es Codex. Se trata de la integración del modelo en un flujo de trabajo específico con herramientas específicas, decisiones UX específicas, opciones de diseño específicas sobre cuándo solicitar confirmación versus cuándo actuar de forma autónoma. Cuando pago $100 al mes por Claude Max, la parte que en realidad no puedo replicar con una clave DeepSeek API no es el modelo; son los ocho meses de refinamientos del flujo de trabajo de Claude Code que Anthropic ha iterado, el agente skills, los comandos de barra diagonal, la forma en que el agente maneja tareas de larga duración. Anthropic no vende tokens. Están vendiendo un entorno de codificación que utiliza tokens.

Esa distinción será cada vez más importante durante los próximos dos años.

El segundo foso es la infraestructura de cumplimiento. Las cargas de trabajo de atención médica, financiera, legal y gubernamental se preocupan por cosas que DeepSeek y Kimi no pueden proporcionar fácilmente: garantías de residencia de datos, pistas de auditoría, certificación SOC 2, políticas de seguridad constitucionales de AI, el tipo de papeleo que permite a un equipo de adquisiciones de Fortune 500 marcar una casilla. Anthropic supuestamente ganó el 70 % de los enfrentamientos empresariales cara a cara contra OpenAI para compradores primerizos de AI, y una parte importante de eso es la madurez de la gobernanza, no la calidad bruta del modelo. Este es el foso que crece con la complejidad regulatoria, y es el que a los laboratorios de peso abierto les resulta más difícil replicar porque el trabajo regulatorio es fundamentalmente ortogonal al trabajo modelo.

El tercer foso es el ecosistema. Este es el Protocolo de contexto del modelo. Estas son las integraciones con Slack, Notion, Figma, Canva, GitHub, todas las bases de datos importantes. Esta es la documentación del desarrollador, la calidad del SDK, la presencia en la conferencia, la forma en que las herramientas de terceros se iluminan en una plataforma. Apple ganó la guerra de las computadoras portátiles contra el ecosistema, no contra el hardware. Los laboratorios AI que ganen en la próxima década ganarán en ecosistema, no en inteligencia de modelos. Y los ecosistemas tardan años en construirse, lo que significa que los laboratorios propietarios tienen una ventaja real, pero de tiempo limitado.

El cuarto foso es la marca y la confianza. Cuando estoy creando algo para un cliente que paga, uso de manera predeterminada Claude o GPT no porque sean considerablemente mejores en la tarea específica, sino porque si algo sale mal puedo defender la elección. "Usé Claude" es una respuesta defendible en una reunión con un cliente. "Utilicé DeepSeek" requiere una explicación de quince minutos sobre por qué un modelo chino de peso abierto es apropiado para su flujo de trabajo HIPAA. Esa defensa vale dinero real, y es un foso en el que los laboratorios propietarios no invierten lo suficiente porque lo dan por sentado.

Para ser sincero, pago 100 dólares al mes por los fosos uno y tres. El modelo ya no es el producto. El arnés es el producto, las integraciones son el producto, el ecosistema es el producto. Todo lo demás se puede replicar con un modelo de peso abierto al precio 1/10th.

Se trata de un negocio fundamentalmente diferente al que Anthropic y OpenAI estaban construyendo en 2024.

Qué significa esto para Anthropic y OpenAI

Los laboratorios fronterizos lo saben. Puedes verlo en su estrategia de producto si estás prestando atención.

Anthropic alcanzó 30 mil millones de dólares en ingresos anualizados en marzo de 2026, aproximadamente un 1400% más año tras año. OpenAI tiene un ARR de aproximadamente $ 25 mil millones. Son cifras extraordinarias, pero lo que importa es la composición. Una parte cada vez mayor de los ingresos de ambas empresas proviene de contratos empresariales e integraciones de plataformas (la capa de aplicación y la capa de cumplimiento), no de las ventas individuales de tokens API. Anthropic y OpenAI lanzaron empresas conjuntas para servicios empresariales AI a principios de mayo. Ninguna de esas empresas se trata de vender tokens. Se trata de vender implementaciones.

El cambio estratégico es claro: dejar de competir en inteligencia de modelos en bruto, donde los laboratorios de peso abierto pueden igualarlo por 1/10th el precio, y comenzar a competir en la capa superior al modelo donde puede cobrar por los resultados en lugar de por la inferencia. Claude Code no tiene el precio del modelo API. Tiene el precio de una herramienta de desarrollo. Codex no tiene el precio del modelo API. Tiene el precio de una suscripción de codificación. Lo que se está mercantilizando es la parte que cada vez más se empaqueta en lugar de venderse como una línea de pedido.

Por eso también es importante la agrupación. Cuando con mis $100 al mes puedo comprar acceso a Sonnet 4.7 y Opus 4.7 más Claude Code más el mercado de habilidades de agente más integraciones MCP más la aplicación de escritorio más el modo de voz más una docena de cosas más, Anthropic no me cobra por el modelo. Anthropic me está cobrando por el paquete y el modelo es la parte del paquete que se está volviendo menos defendible. Si se separa el paquete, el modelo por sí solo vale quizás 20 dólares al mes según los puntos de referencia actuales de peso abierto. Si se separa el paquete, la capa de aplicación por sí sola vale entre 80 y 120 dólares al mes fácilmente. La agrupación no es accidental. Es la estrategia de supervivencia.

El riesgo es lo que sucede cuando un tercero crea una capa de aplicación suficientemente buena sobre un modelo abierto. Eso ya no es hipotético. OpenCode es un competidor creíble de Claude Code que se ejecuta en múltiples modelos de backend. La suscripción a OpenCode Go le brinda cuatro agentes paralelos y acceso a V4 Pro, V4 Flash y varios otros modelos abiertos por $5 el primer mes y $10 un mes después. Eso es un descuento del 90 % en una pila que hace la mayor parte de lo que hace Claude Code. El foso de la capa de aplicación es real, pero no infinito. El ecosistema de código abierto lo destruirá de la misma manera que destruyó la capa del modelo.

Aquí es donde se vuelve interesante la cuestión existencial. Si Adobe (para usar el ejemplo al que sigo volviendo) incluye un DeepSeek V4 Pro ajustado dentro de Photoshop y lo envía como "Adobe Intelligence" con integración completa del sistema de diseño y un UX pulido, ¿qué es exactamente lo que vende Anthropic que no puedo obtener de Adobe? ¿Qué vende OpenAI que no pueda obtener de un competidor motivado de manera similar y con una distribución profunda? El modelo se vuelve invisible. La capa de aplicación es lo que paga el cliente. Y todas las empresas de aplicaciones del planeta ahora tienen un camino para crear las suyas propias.

Qué estoy haciendo con mi pila de suscripciones

Permítanme ser específico sobre lo que está cambiando en mi propia configuración, porque el panorama estratégico sólo importa si realmente cambia el comportamiento.

Mantendré Claude Max por ahora. El valor de la capa de aplicación es real, el gusto por el diseño en la salida de Opus 4.7 sigue siendo realmente mejor que cualquier cosa que pueda obtener de los modelos abiertos, y el [sistema de habilidades de agente] de Claude Code (/agent-skills-advanced-claude-code) hace cosas que no puedo reproducir en ningún otro lugar. Pero estoy observando atentamente los precios. Si Anthropic aumenta el nivel Max o debilita el valor, bajaré a Pro y dirigiré el trabajo pesado a través de OpenRouter.

Mantendré Codex Plus por el mismo motivo. El límite promocional de 25x hasta el 31 de mayo hace que el plan de $20 tenga un valor absurdamente bueno en este momento, y la eficiencia de GPT-5.5 en el ciclo de codificación agente es la mejor de su clase para el tipo de trabajo de backend que hago. Después del 31 de mayo, los límites vuelven a bajar a 5x y lo volveré a evaluar.

Estoy aumentando deliberadamente mi gasto en OpenRouter y DeepSeek. Quiero suficiente fluidez operativa con la pila de peso abierto para que, si las suscripciones propietarias dejan de tener sentido, pueda cambiar la mayor parte de mi carga de trabajo con un fin de semana de esfuerzo en lugar de una cuarta parte del dolor de la migración. Se trata de una cobertura estratégica, no de una optimización inmediata de costes. La optimización de costes es un efecto secundario. Cubrí el enfoque de proxy Claude Code gratuito en detalle si desea configurar la misma infraestructura alternativa.

Estoy ejecutando OpenCode en paralelo durante al menos un proyecto al mes. No porque esté apagando Claude Code (no lo estoy haciendo), sino porque la brecha entre los agentes de codificación de código abierto y los propietarios se está cerrando más rápido de lo que la mayoría de la gente cree, y el día en que un agente externo se acerque al 95% del UX de Claude Code es el día en que una parte significativa de los ingresos de Anthropic está en riesgo. Quiero saber cuándo es ese día y prefiero saberlo temprano que tarde.

No agregaré nuevas suscripciones propietarias hasta que vea un foso que lo justifique. Gemini Advanced, Cursor Pro, las diversas herramientas empresariales AI: ninguna de ellas me ha mostrado una capa de aplicación que sea lo suficientemente distinta de la que ya tengo. Hasta que eso cambie, la pila de peso abierto absorberá cualquier carga de trabajo nueva que no tenga una razón específica para vivir en una plataforma propietaria.

Esa es la disciplina que estoy incorporando a mi propio uso. Suscríbase donde la capa de aplicación crea valor que no puedo obtener en ningún otro lugar. Paga tokens donde el modelo es lo único que importa. Ejecute modelos de peso abierto en todos los lugares que pueda sin sacrificar la calidad de salida. Y reevaluar todo el conjunto cada trimestre, porque la curva de precio por calidad se está moviendo lo suficientemente rápido como para que la asignación óptima del último trimestre sea el gasto excesivo de este trimestre.

Qué significa esto para desarrolladores individuales y equipos pequeños

Si eres un desarrollador en solitario o diriges un equipo pequeño, aquí tienes la versión práctica.

Comience con una suscripción propietaria, no con tres. Elija la capa de aplicación en la que va a vivir. Para la mayoría de los constructores en este momento, eso es Claude Code en el plan Pro de $20 o Codex en el plan Plus de $20. No necesitas ambos. Elija aquel cuyo UX coincida con su forma de trabajar, comprométase con él durante al menos un mes y deje de realizar comparaciones cada semana.

Agregue un único punto de acceso abierto como alternativa. OpenRouter es la entrada más limpia: una cuenta, una clave API, docenas de modelos, [modelos gratuitos para trabajos de bajo riesgo] (/claude-code-openrouter-free-models). Gaste $20 para cargar créditos y enrutar cualquier carga de trabajo que no sea crítica para la latencia o la calidad a través de Kimi K2.6 o DeepSeek V4. Te sorprenderá saber cuánto de tu trabajo diario se ajusta a ese perfil.

Utilice los ahorros para pagar herramientas que se componen. La capa de aplicación es donde está el foso, y eso incluye herramientas que no son suscripciones AI. Una buena plataforma de observabilidad. Una configuración de prueba real. Una base de datos vectorial con búsqueda híbrida adecuada. El apalancamiento que obtienes de esos compuestos con cualquier modelo que estés ejecutando, y no pierden valor cuando la capa del modelo se mueve debajo de ti.

Esté atento a la consolidación. El precio actual es inestable. Dentro de doce meses espero que al menos un laboratorio propietario importante se una de manera agresiva, que al menos una importante empresa de aplicaciones envíe un producto AI vertical creíble en una infraestructura de peso abierto, y que al menos un laboratorio de peso abierto lance un modelo que cierre la brecha restante en el trabajo de agencia de contexto largo. Cuando sucede cualquiera de esas cosas, la pila de suscripción óptima cambiará, y la única manera de saberlo es prestando suficiente atención para poder reevaluar cuando lleguen las señales.

Si dirige un equipo de tres a diez personas, el cálculo es diferente. Centralice el acceso a su modelo a través de una única puerta de enlace (OpenRouter o su propia capa de enrutamiento) para que pueda intercambiar proveedores sin tocar el código de la aplicación. Negocie precios empresariales con el laboratorio que le ofrezca el mejor valor en la capa de aplicación, porque los descuentos por volumen en el lado propietario siguen siendo significativos. Mantenga caliente al menos un modelo abierto en producción, incluso si solo maneja el 10% del tráfico. El día que necesites dedicarte a ello, no querrás realizar el trabajo de integración por primera vez.

Para equipos más grandes, la respuesta es cada vez más que el modelo es una decisión de adquisición, no una decisión de ingeniería. El trabajo de ingeniería está en la capa de aplicación. Esa es la parte que crea la diferenciación. Quien tome sus decisiones de suscripción a AI en 2026 debería ser la misma persona que tome sus decisiones sobre herramientas de desarrollador, porque la línea entre las dos efectivamente ha desaparecido.

El panorama más amplio

No creo que Anthropic o OpenAI vayan a desaparecer. Las empresas están demasiado bien posicionadas, los fosos de la capa de aplicación son demasiado reales y la prima de marca es demasiado valiosa para evaporarse rápidamente. Pero sí creo que el negocio que dirigen en 2027 será diferente del negocio que dirigen hoy.

El modelo de suscripción tradicional AI (páguenos una tarifa mensual fija para acceder a nuestro modelo, y el modelo es el producto) está bajo una gran presión. Funciona ahora porque la capa de aplicación está incluida en la suscripción y la mayoría de los usuarios no pueden separar ambas fácilmente. A medida que los modelos abiertos sigan cerrando la brecha de capacidad, el paquete se verá presionado por ambas partes: terceros que crean capas de aplicaciones competitivas sobre modelos abiertos baratos y usuarios inteligentes que dirigen cargas de trabajo a cualquier proveedor que ofrezca la mejor relación precio-calidad en una tarea determinada.

El futuro al que creo que nos dirigimos es el de cientos de ganadores, no dos o tres. Diferentes capas de aplicación para diferentes verticales. Diferentes modelos de peso abierto para diferentes perfiles de sensibilidad a los costes. Diferentes herramientas de orquestación que se enrutan entre ellas según la tarea. Los laboratorios de frontera seguirán siendo importantes: seguirán entrenando los modelos que los laboratorios de peso abierto están aplicando ingeniería inversa, seguirán vendiendo las capas de aplicación más pulidas y seguirán cobrando primas en las industrias reguladas. Pero serán un segmento de un mercado mucho más amplio, no el mercado completo.

En mi opinión, esa es una industria más saludable. Es una industria más competitiva. Es una industria donde lo que importa es lo que construyes sobre el modelo, no si eres dueño del modelo. Y es una industria donde la pila de suscripciones que estoy ejecutando hoy (tres planes propietarios, tres claves API, media docena de herramientas) parecerá un artefacto de una era anterior dentro de dieciocho meses.

Estoy pagando por suscripciones propietarias hoy porque la capa de aplicación todavía es donde está el valor, y los laboratorios propietarios todavía construyen las mejores capas de aplicación. Seguiré pagando mientras eso sea cierto. Pero estoy desarrollando el músculo para cambiar en el momento en que no sea así, porque la alternativa (llevar una pila de suscripciones a la obsolescencia porque cambiarla parecía demasiado trabajo) es el error más costoso que podría cometer en un mercado que se está moviendo tan rápido.

Así que mira tu propia pila. Suma lo que estás pagando. Pregúntese qué suscripciones le compran un modelo y cuáles le compran una capa de aplicación. Cancela los que solo te están comprando un modelo. Utilice los ahorros para pagar aquellos que le están comprando un flujo de trabajo que realmente no podría crear usted mismo. Y ejecute un modelo de peso abierto en paralelo, incluso si es solo para una carga de trabajo, incluso si es solo por una tarde a la semana, porque el día que las matemáticas cambian, ya querrá saber cómo vivir en ese mundo.

Esa es la apuesta que estoy haciendo. El modelo se está convirtiendo en una mercancía. La capa de aplicación es el producto. Y es casi seguro que la pila de suscripciones que está ejecutando el 6 de mayo de 2026 no es la pila de suscripciones que debería ejecutar el 6 de mayo de 2027.

Preguntas frecuentes

¿Las suscripciones a AI seguirán valiendo la pena en 2026?

Sí, pero por una razón más estrecha que hace dos años. El modelo en sí es ahora una mercancía: opciones de peso abierto como DeepSeek V4 Pro y Kimi K2.6 igualan la frontera patentada en la mayoría de los puntos de referencia de codificación a un costo de 1/10th. Lo que realmente estás pagando por $100/month es la capa de aplicación: Claude Code, Codex, las habilidades del agente, las integraciones, el pulido UX. Si la capa de aplicación crea valor que no puede replicar, la suscripción vale la pena. Si no es así, enrútelo a través de OpenRouter.

¿Qué es la capa de aplicación en AI?

La capa de aplicación es todo lo que rodea un modelo básico AI que lo convierte en un producto útil: el arnés del agente de codificación, las integraciones del flujo de trabajo, las decisiones de UX, las políticas de seguridad, las herramientas del desarrollador, el ecosistema de complementos de terceros. Claude Code y Codex son capas de aplicaciones creadas sobre los modelos Claude y GPT. A medida que la inteligencia de modelos se mercantiliza, la capa de aplicación es donde vive el foso duradero.

¿Cuánto ahorro realmente con los modelos de peso abierto?

En cuanto a los costos de tokens sin procesar, aproximadamente entre 4 y 30 veces, según el modelo y la carga de trabajo. Claude Opus 4.7 cuesta alrededor de $4,811 para ejecutar la suite de Índice de Inteligencia de Análisis Artificial versus $1,071 para DeepSeek V4 Pro. Una carga de trabajo de 100 millones de tokens por mes cuesta alrededor de $310 en Kimi K2.6 frente a $4,000+ en GPT-5.4. El problema es que estás pagando por tokens sin procesar: no obtienes la capa de aplicación (Claude Code, Codex) sin construirla tú mismo o usar algo como OpenCode.

¿Debo cancelar Claude Max o Codex Plus?

No canceles ambos, pero probablemente no los necesites. Elija la capa de aplicación que coincida con su forma de trabajar: Claude Max si realiza trabajos de diseño avanzado y de formato largo, Codex Plus si realiza trabajos de backend, ML y canalización de datos, y dirija todo lo demás a través de un modelo de peso abierto en OpenRouter. La promoción actual de 25x Codex hasta el 31 de mayo de 2026 hace que el plan $20 Plus tenga un valor excepcional si Codex coincide con su flujo de trabajo.

¿Qué es OpenRouter y cómo encaja?

OpenRouter es un único punto final API que le brinda acceso a más de 300 modelos AI, propietarios y abiertos, sin tarifa mensual. Agrega créditos y paga por token a un precio cercano al precio bruto del proveedor. Es la forma más limpia de recurrir a modelos abiertos sin administrar múltiples claves API, y el nivel gratuito (velocidad limitada a 20 solicitudes por minuto, 200 por día) es suficiente para trabajos por lotes de bajo riesgo. Lo uso como capa de enrutamiento detrás de cualquier carga de trabajo que no necesita residir en una plataforma propietaria.

Trabajemos juntos

¿Quiere crear sistemas AI, automatizar flujos de trabajo o ampliar su infraestructura tecnológica? Me encantaría ayudar.

Fiverr (compilaciones e integraciones personalizadas): fiverr.com/s/EgxYmWD
Cartera: mejba.me
Ramlit Limited (soluciones empresariales): ramlit.com
ColorPark (diseño y marca): colorpark.io
xCyberSecurity (servicios de seguridad): xcybersecurity.io

Por qué las suscripciones de IA están a punto de comoditizarse