Probé GPT 5.4 Thinking — Esto Es Lo Que Realmente Cambió
Hice que GPT 5.4 Thinking me creara una presentación de 15 diapositivas, una hoja de cálculo de Excel completamente funcional con fórmulas en vivo y un informe de investigación con citas — todo dentro de la misma sesión, todo en menos de diez minutos. Luego le pedí que escribiera un gancho para YouTube con mi voz, y sonó como un comunicado de prensa corporativo disfrazado de casual.
Esa contradicción — asombrosamente capaz en algunas áreas, frustrantemente desafinado en otras — es el resumen más honesto que puedo darte del último modelo insignia de OpenAI. GPT 5.4 Thinking no es una pequeña actualización incremental. Es un salto genuino en ciertas dimensiones y un movimiento lateral en otras. Después de dos días de pruebas intensivas en codificación, investigación, creación de documentos y generación de contenido, tengo una imagen clara de dónde brilla este modelo, dónde tropieza y — lo más importante — dónde encaja en un panorama donde Opus 4.6 de Anthropic y Gemini 3.1 Pro de Google compiten por la misma corona.
Antes de entrar en benchmarks, necesitas entender la línea de modelos porque OpenAI no lanzó solo una cosa — lanzaron una familia.
Tres Modelos, Tres Funciones, Un Esquema de Nombres Confuso
La generación GPT 5.x de OpenAI ahora tiene tres variantes distintas, y las diferencias entre ellas importan más de lo que sugerirían los nombres por sí solos.
GPT 5.4 Thinking es el modelo principal — el diseñado para razonamiento profundo y tareas complejas. Cuando le preguntas algo difícil, no simplemente genera una respuesta. Entra en una fase visible de "pensamiento" donde el modelo procesa, delibera y trabaja el problema antes de responder. Piensa en él como el modelo que hace una pausa para considerar en lugar de soltar la primera respuesta plausible. Este proceso de pensamiento es la razón por la que destaca en síntesis de investigación, análisis de múltiples pasos y tareas donde acertar la cadena de razonamiento importa más que la velocidad bruta. Los tokens de pensamiento no se cobran igual que los tokens de salida, lo que mantiene los costos razonables a pesar del procesamiento adicional.
GPT 5.4 Pro es el nivel de investigación — la misma arquitectura subyacente pero con tiempo de pensamiento extendido, límites de contexto más altos y acceso a más cómputo por consulta. OpenAI lo posiciona para usuarios profesionales y empresariales que necesitan el techo absoluto de capacidad y están dispuestos a pagar significativamente más por consulta para obtenerlo. No he tenido suficiente tiempo con Pro para dar una evaluación definitiva, pero las pruebas iniciales sugieren que la diferencia de calidad sobre el 5.4 Thinking estándar es más notable en tareas muy largas y muy complejas — análisis de múltiples documentos, revisiones de código exhaustivas en repositorios grandes, ese tipo de cosas. Para el trabajo de conocimiento cotidiano, el 5.4 Thinking estándar es más que suficiente.
GPT 5.3 Instant toma el enfoque opuesto. La velocidad es el punto central. Sacrifica profundidad por capacidad de respuesta, entregando respuestas en fracciones de segundo en lugar de los 5-15 segundos que a veces requiere el modo Thinking. La calidad es notablemente inferior en tareas complejas — puedes sentir al modelo tomando atajos en el razonamiento — pero para consultas rápidas, lluvia de ideas, interacciones tipo chat y tareas donde "suficientemente bueno en 0.3 segundos" supera a "excelente en 12 segundos," Instant es genuinamente útil. He empezado a usarlo como mi opción predeterminada para preguntas rápidas durante sesiones de desarrollo donde necesito una verificación rápida, no un análisis profundo.
El enfoque de tres niveles tiene sentido estratégico. OpenAI está reconociendo lo que los usuarios avanzados ya saben: diferentes tareas necesitan diferentes compromisos entre velocidad y calidad. Pero la nomenclatura es un desastre. "GPT 5.4 Thinking" versus "GPT 5.3 Instant" implica que Instant es una generación anterior, cuando en realidad es un modelo contemporáneo optimizado para un caso de uso diferente. Sospecho que OpenAI limpiará la nomenclatura eventualmente, pero por ahora, simplemente recuerda: Thinking = profundo y exhaustivo, Pro = capacidad máxima, Instant = rápido y ligero.
Con la familia de modelos mapeada, aquí está lo que cambia el juego en la arquitectura de GPT 5.4 de una manera que la mayoría de los revisores aún no están discutiendo.
El Uso Nativo del Computador Cambia Toda la Propuesta de Valor
Cada modelo GPT anterior era esencialmente una máquina de texto-entra, texto-sale. Claro, podías conectarlo a plugins, conectarlo a herramientas de navegación, construir flujos de trabajo de agentes a su alrededor. Pero el modelo en sí vivía dentro de una ventana de chat. Podía decirte qué hacer en tu computadora. No podía hacerlo.
GPT 5.4 cruza esa línea.
El uso nativo del computador significa que el modelo puede realizar acciones web directamente — entrada de datos, gestión de correos electrónicos, interacción con aplicaciones de calendario, llenado de formularios. No a través de una capa de automatización de navegador precaria que se rompe cada vez que un sitio web cambia su CSS. Nativamente. Como una capacidad integrada que OpenAI ha incorporado en la funcionalidad central del modelo.
He estado observando esta capacidad evolucionar en todo el panorama de la IA. Anthropic introdujo el uso del computador con Claude en 2024, y Google ha estado experimentando con funciones similares a través de Project Mariner y las capacidades de agente de Gemini. Pero la implementación de GPT 5.4 se siente diferente por lo fluida que se integra con el ecosistema existente de ChatGPT. No necesitas configurar un agente separado ni configurar un sandbox de navegador. Simplemente... le pides que haga algo en la web, y lo hace.
Las implicaciones para los trabajadores del conocimiento son enormes, y recorreré algunos ejemplos específicos más adelante. Pero primero — la parte que todos realmente quieren saber.
Los Benchmarks Cuentan la Mitad de la Historia
Los materiales de marketing de OpenAI posicionan a GPT 5.4 Thinking como estado del arte, reclamando una ligera ventaja sobre Opus 4.6 y Gemini 3.1 Pro en ciertos benchmarks. Después de ejecutar mis propias pruebas, aquí está mi evaluación honesta: tienen razón en lo de "ligera," y están siendo generosos con "ventaja."
En tareas de trabajo de conocimiento — crear documentos estructurados, sintetizar investigación, construir salidas formateadas — GPT 5.4 es genuinamente impresionante. Maneja lógica compleja de hojas de cálculo que habría confundido completamente a GPT 5.2. Las fórmulas son correctas, el formato está limpio y los gráficos realmente tienen sentido visual. Esto no es la salida "casi correcta" que hemos estado tolerando de la generación de documentos con IA durante el último año. Está listo para producción.
En tareas de codificación, la imagen se vuelve más interesante. OpenAI afirma que las capacidades de codificación de GPT 5.4 ahora igualan a su modelo especializado GPT 5.3 Codex — la variante específicamente ajustada para generación de código que los desarrolladores han estado usando a través de la API. Mis pruebas confirman esto parcialmente — las tareas de codificación simples a moderadamente complejas se manejan bien, con mayor precisión que GPT 5.2, y el hecho de que un modelo de propósito general ahora iguale a uno especializado en código es genuinamente impresionante. Pero "igualar a Codex" y "ser el mejor modelo de codificación disponible" no son la misma afirmación. Construí una pequeña aplicación web con tarjetas redondeadas y un toggle de modo claro/oscuro. GPT 5.4 entregó una implementación funcional, pero algunos enlaces no funcionaban y las funciones de filtrado que solicité en realidad no filtraban nada. ¿Funcional? Sí. ¿Impresionante? Algo. ¿Mejor que lo que obtengo de Opus 4.6 en Claude Code? Honestamente, no — y lo digo como alguien que usa ambos ecosistemas a diario.
Aquí está la tabla comparativa de mis pruebas:
| Capacidad | GPT 5.4 Thinking | Opus 4.6 | Gemini 3.1 Pro |
|---|---|---|---|
| Síntesis de investigación | Excelente — rápida, bien estructurada, con citas | Muy buena | Muy buena |
| Creación de hojas de cálculo/documentos | La mejor de su clase | Buena (vía artefactos) | Buena |
| Codificación (simple-media) | Fuerte mejora sobre 5.2 | La más sólida en general | Competitiva |
| Codificación (compleja/interactiva) | Aún tiene brechas | La más confiable | Inconsistente |
| Escritura (tono natural) | La más débil de las tres | Sólida | Sólida |
| Uso nativo del computador | Integrado, fluido | Disponible pero en sandbox | Disponibilidad limitada |
| Eficiencia de tokens | Mejorada sobre 5.2 | Eficiente | Muy eficiente |
| Tasa de alucinación | 33% de reducción declarada | Baja | Baja |
La reducción del 33% en alucinaciones respecto a GPT 5.2 merece mención específica porque aborda una de las críticas más persistentes de la línea GPT. Ejecuté varias pruebas de recuperación factual — especificaciones técnicas, fechas históricas, detalles de documentación de API — y GPT 5.4 fue notablemente más cuidadoso al calificar respuestas inciertas. Dijo "No estoy seguro de este número de versión específico" en situaciones donde GPT 5.2 habría alucinado con confianza una respuesta que sonara plausible.
Dicho esto, "33% menos alucinaciones" todavía significa que las alucinaciones ocurren. Confiar pero verificar sigue siendo el único enfoque sensato. Pero la tendencia es alentadora.
Lo que los benchmarks no capturan en absoluto es la sensación de trabajar con estos diferentes modelos — y ahí es donde viven mis opiniones más firmes.
El Flujo de Trabajo de Investigación Que Realmente Me Impresionó
La mayoría de las reseñas de modelos de IA prueban las capacidades de investigación haciendo una sola pregunta y evaluando la respuesta. Esa es una prueba terrible. Nadie usa la investigación con IA de esa manera en la práctica. La investigación real es iterativa — comienzas con una pregunta amplia, obtienes resultados, estrechas tu enfoque, ajustas tu ángulo, profundizas en un hilo específico.
GPT 5.4 Thinking maneja este flujo iterativo mejor que cualquier modelo que haya probado.
Comencé con una consulta amplia: "Analiza el estado actual de las herramientas de automatización de marketing impulsadas por IA, enfocándote en líderes del mercado, modelos de precios y capacidades de integración." El modelo comenzó su proceso de pensamiento, buscó en la web y devolvió un análisis estructurado en unos 45 segundos. Secciones limpias, nombres de productos específicos con precios actuales, comparaciones de ecosistemas de integración. Bueno pero no extraordinario — Gemini y Claude pueden hacer un trabajo similar.
Aquí es donde se puso interesante. Dije: "En realidad, reduce esto a herramientas que se integren específicamente con Shopify para email marketing de comercio electrónico, y agrega una comparación de sus capacidades de personalización con IA."
Con GPT 5.2, este tipo de giro a mitad de camino habría requerido esencialmente empezar de cero. El modelo lo trataría como una nueva pregunta, perdiendo el contexto del primer pase de investigación. GPT 5.4 ajustó sus parámetros de búsqueda, mantuvo los hallazgos relevantes de la primera consulta y construyó sobre ellos. La salida refinada cruzó la referencia de la visión general del mercado original con datos de integración específicos de Shopify, produciendo una comparación que se sentía como si viniera de alguien que realmente hizo una inmersión profunda en lugar de dos búsquedas superficiales separadas.
La salida estaba estructurada en hallazgos con citas, una matriz de comparación competitiva y — un bonito detalle — una lista de verificación de criterios de evaluación para hacer una selección final. El tipo de entregable que me habría tomado 2-3 horas de investigación manual para producir.
Lo llevé un paso más allá y le pedí que convirtiera la investigación en una presentación. Quince diapositivas, correctamente estructuradas, con un flujo narrativo lógico desde la visión general del mercado hasta recomendaciones específicas. El diseño predeterminado era corporativo-insulso (como se esperaba), pero cuando pedí un rediseño minimalista y moderno, la segunda versión era genuinamente utilizable. No ganadora de premios — pero absolutamente suficiente para una reunión estratégica interna.
Luego le pedí que construyera una hoja de cálculo de Excel resumiendo los puntos de datos clave con fórmulas de comparación y un gráfico. Entregó un archivo .xlsx descargable con fórmulas VLOOKUP funcionales, formato condicional y un gráfico de barras comparando precios entre proveedores. Lo abrí en Excel y todo funcionaba. Sin referencias rotas, sin errores de fórmula, sin datos fantasma.
Este es el flujo de trabajo donde GPT 5.4 absolutamente se gana su lugar. Investigación → Presentación → Hoja de cálculo, todo en una conversación, cada uno construyendo sobre la salida anterior. Para trabajadores del conocimiento que pasan sus días ensamblando información en documentos, este es un multiplicador de productividad genuino.
Pero hay una advertencia significativa que necesito abordar antes de que alguien se emocione demasiado con esas capacidades de hojas de cálculo.
El Complemento de Excel Es Impresionante Pero No Es Lo Que Piensas
OpenAI lanzó el complemento ChatGPT para Excel junto con GPT 5.4, disponible para suscriptores de pago. Sobre el papel, suena como la función definitiva para usuarios empresariales — integración de IA fluida directamente dentro de tus hojas de cálculo.
En la práctica, es útil pero más limitado de lo que sugiere el marketing. El complemento te permite usar funciones GPT dentro de celdas de Excel, lo cual es genial para tareas como categorizar datos, extraer información de columnas de texto o generar fórmulas basadas en descripciones en lenguaje natural. Lo que no hace es convertir Excel en una plataforma de análisis totalmente potenciada por IA. Sigues trabajando dentro del paradigma de Excel; la IA solo ayuda con tareas específicas a nivel de celda.
Donde encontré valor genuino fue en la generación de fórmulas. Describir lo que quería en español llano — "calcula la tasa de crecimiento interanual comparando la columna C con la columna D, pero solo para las filas donde la columna A contiene 'Enterprise'" — y obtener una fórmula funcional de vuelta instantáneamente. Eso ahorra tiempo real, especialmente para fórmulas anidadas complejas que de otro modo requerirían veinte minutos de consultar documentación.
Donde no encontré mucho valor fue en los casos de uso más amplios de "IA en Excel." Para análisis serio de datos, preferiría exportar los datos y trabajar con ellos en Claude Code o un notebook de Python. El enfoque de IA celda por celda se siente como usar un auto de carreras para ir al buzón — técnicamente funciona, arquitectónicamente incorrecto para la tarea.
La verdadera historia de GPT 5.4 no es ninguna característica individual. Es el patrón de para qué está optimizando OpenAI — y para qué no.
Dónde GPT 5.4 Se Queda Corto (Y Por Qué Importa)
Le pedí a GPT 5.4 Thinking que escribiera cinco ganchos para videos de YouTube en un tono conversacional y directo. "Sin lenguaje corporativo. Sin guiones largos. Escribe como si estuvieras hablando con un amigo que te hizo una pregunta."
La primera salida usó cuatro guiones largos en cinco ganchos.
Clarifiqué: "Cero guiones largos. Ninguno. Ni uno."
La segunda salida usó dos guiones largos y agregó "además" a uno de los ganchos.
Esta no es una queja menor. La adherencia al estilo de escritura es una de las capacidades más fundamentales que los creadores de contenido necesitan de un modelo de IA, y GPT 5.4 es mediblemente peor en esto que tanto Claude como Gemini. He pasado suficiente tiempo con los tres para decir esto con confianza: si tu caso de uso principal es generar contenido que coincida con una voz o estilo específico, GPT 5.4 no debería ser tu primera opción.
El problema no es que el modelo no pueda generar buen texto. Las oraciones individuales están bien construidas. El vocabulario es sofisticado. Las ideas son relevantes. Pero GPT 5.4 tiene una tendencia persistente a caer en un registro formal, ligeramente académico, que le cuesta superar incluso con instrucciones explícitas. Es como trabajar con un consultor brillante que fue a una escuela de negocios y no puede dejar de decir "sinergizar" sin importar cuántas veces le pidas que hable normalmente.
Claude — particularmente en la iteración actual de Opus 4.6 — maneja la adherencia de estilo dramáticamente mejor. Cuando le digo a Claude "escribe en un tono conversacional en primera persona," la salida realmente suena conversacional. Cuando le digo "sin palabras de transición como además o sin embargo," esas palabras desaparecen. La brecha de seguimiento de instrucciones entre GPT 5.4 y Claude en restricciones estilísticas es lo suficientemente amplia como para que no consideraría cambiar mis flujos de trabajo de generación de contenido.
Gemini 3.1 Pro se sitúa en el medio. Mejor que GPT 5.4 para igualar tonos conversacionales, no tan flexible como Claude para instrucciones de estilo matizadas, pero generalmente confiable para tareas de contenido sencillas.
Esto importa porque revela para qué está optimizando OpenAI con la línea GPT 5.4 — y qué están depriorizando. El modelo está claramente diseñado para trabajo de conocimiento: investigación, análisis, creación de documentos, salidas estructuradas. Estos son casos de uso empresariales con potencial de ingresos empresariales. La generación de contenido con una voz de marca específica es un caso de uso de la economía creativa con menos valor empresarial obvio. Las elecciones de optimización tienen sentido comercial aunque frustren a personas como yo que quieren un modelo que haga todo.
Lo que me lleva a la pregunta que sigo haciéndome después de cada lanzamiento de modelo nuevo.
La Realidad Multi-Modelo Que Nadie Quiere Aceptar
Aquí va una opinión que puede sonar obvia pero que casi nadie realmente aplica: no hay un único mejor modelo de IA. Ni GPT 5.4. Ni Opus 4.6. Ni Gemini 3.1 Pro. El modelo correcto depende enteramente de lo que estés haciendo con él.
Sé que eso es insatisfactorio. Queremos un ganador. Queremos decir "usa este" y listo. Pero después de probar los tres extensivamente — y me refiero a trabajo real en proyectos, no puzzles de benchmarks — la respuesta honesta es que uso diferentes modelos para diferentes tareas, y probablemente tú también deberías.
Mi asignación actual de modelos se ve así:
-
Codificación y desarrollo de software: Opus 4.6 en Claude Code. Ni se acerca. El flujo de trabajo agéntico, el acceso al sistema de archivos, la capacidad de iterar en un código base en lugar de generar fragmentos aislados — nada más iguala esta experiencia ahora mismo.
-
Investigación y creación de documentos: GPT 5.4 Thinking. El pipeline de investigación-a-presentación-a-hoja de cálculo no tiene rival. Si necesito producir un documento de estrategia, un análisis de mercado o un informe formateado, aquí es donde empiezo.
-
Generación de contenido y escritura: Claude (Opus o Sonnet, dependiendo de la complejidad). Mejor adherencia de estilo, mejor seguimiento de instrucciones para trabajo creativo y de voz de marca, salida conversacional más natural.
-
Preguntas rápidas y lluvia de ideas: Gemini 3.1 Pro o GPT 5.3 Instant. La velocidad importa más que la profundidad para ideación rápida, y ambos son lo suficientemente rápidos para sentirse como una conversación en tiempo real. Las respuestas de menos de un segundo de Instant lo hacen sentir como autocompletado con esteroides — perfecto para consultas tipo "¿cuál es la sintaxis para X?" o "dame cinco nombres para Y."
-
Uso del computador y automatización web: GPT 5.4 por ahora, aunque este panorama está cambiando rápidamente a medida que Claude y Gemini expanden sus capacidades de agente.
Este enfoque multi-modelo agrega complejidad. Necesitas cuentas con múltiples proveedores. Necesitas desarrollar intuición para qué modelo se ajusta a qué tarea. Necesitas cambiar de contexto entre diferentes interfaces y paradigmas de interacción. Es más desordenado que tener una herramienta para todo.
Pero también es dramáticamente más efectivo. Usar GPT 5.4 para una tarea donde Claude destaca (o viceversa) significa que estás obteniendo el 70% de la calidad posible cuando podrías estar obteniendo el 95%. A lo largo de decenas de tareas por semana, esa brecha de calidad se acumula en una diferencia de productividad significativa.
Las personas que obtendrán más valor de GPT 5.4 no son las que se cambien exclusivamente a él. Son las que lo agregan a su kit de herramientas para los casos de uso específicos donde supera a todo lo demás — y siguen usando otros modelos donde esos modelos son más fuertes.
Economía de Tokens: La Historia Oculta en los Precios de GPT 5.4
OpenAI tomó una decisión de precios interesante con GPT 5.4. El costo por token es ligeramente mayor que GPT 5.2, pero el modelo usa menos tokens para lograr las mismas tareas. Esto significa que el costo real por tarea es menor en la mayoría de los casos, aunque el precio de lista subió.
Rastreé el uso de tokens en diez tareas comparables entre GPT 5.2 y GPT 5.4. En promedio, GPT 5.4 usó un 22% menos de tokens para salidas equivalentes. Factorizando el cambio de precio, el costo neto fue aproximadamente un 15% menor por tarea. No un ahorro dramático, pero significativo a escala — especialmente para equipos que ejecutan cientos de llamadas a la API diariamente.
La mejora en eficiencia de tokens también significa respuestas más rápidas. Menos tokens generados significa menos tiempo esperando, lo cual se acumula cuando ejecutas flujos de trabajo iterativos donde cada paso depende de la salida anterior. Mi pipeline de investigación-a-presentación se completó aproximadamente un 30% más rápido con GPT 5.4 comparado con 5.2, lo que se traduce en ahorro de tiempo real a lo largo de un día laboral.
Para usuarios de API que construyen productos sobre GPT, esta ganancia de eficiencia es probablemente la mejora más prácticamente significativa en toda la versión. No es el tipo de cosa que aparece en titulares, pero es el tipo de cosa que aparece en tu factura mensual de OpenAI.
Lo Que Esto Significa Para los Próximos Seis Meses
He estado probando nuevos modelos de IA cada pocas semanas durante más de un año, y ha surgido un patrón claro. Cada nueva versión de cualquier proveedor importante reduce la brecha con los competidores en sus áreas débiles mientras avanza más en sus áreas fuertes. GPT 5.4 sigue este patrón exactamente — cerró terreno con las capacidades de codificación de Claude (aunque no las superó), avanzó más en trabajo de conocimiento y creación de documentos, e hizo mejoras incrementales en las tasas de alucinación.
La dinámica competitiva que esto crea es genuinamente buena para los usuarios. OpenAI mejorando la codificación empuja a Anthropic a mejorar sus capacidades de investigación. Google mejorando ambas empuja a todos a optimizar la eficiencia de tokens. Nadie puede descansar en una sola ventaja porque los otros proveedores cerrarán esa brecha en uno o dos ciclos de lanzamiento.
Lo que estoy observando para los próximos seis meses:
De OpenAI: Un GPT 5.5 o GPT 6 que finalmente resuelva la adherencia al estilo de escritura. Esta es la brecha más obvia en su línea, y lo saben. Los clientes empresariales que están cortejando necesitan consistencia de voz de marca tanto como necesitan capacidades de investigación.
De Anthropic: Uso del computador expandido y un pipeline de creación de documentos más robusto. El dominio de Claude en codificación está asegurado por ahora, pero la brecha de trabajo de conocimiento con GPT 5.4 es real.
De Google: Las capacidades de pensamiento profundo de Gemini aplicadas a tareas más largas y complejas. Google tiene la ventaja de datos (Search, YouTube, Scholar) que ningún competidor puede igualar; la pregunta es si pueden traducir el acceso a datos en capacidad del modelo.
El modelo que más me entusiasma no es ningún lanzamiento específico — es el flujo de trabajo donde puedo dirigir tareas al mejor modelo disponible automáticamente, sin cambio manual. Aún no estamos ahí, pero nos acercamos con cada lanzamiento.
Deja de Esperar el Modelo Perfecto
Abrí este artículo describiendo a GPT 5.4 construyéndome una presentación, una hoja de cálculo y un informe de investigación en menos de diez minutos — y luego fallando al escribir un simple gancho sin guiones largos. Esa contradicción no se ha resuelto. No se resolverá en esta generación de modelos, y probablemente tampoco en la próxima.
El modelo de IA perfecto todo-en-uno es una fantasía que está impidiendo que las personas obtengan valor real de los modelos imperfectos que existen ahora mismo. GPT 5.4 Thinking es el mejor modelo de trabajo de conocimiento e investigación disponible hoy. No es el mejor modelo de codificación. No es el mejor modelo de escritura. No es el mejor modelo de nada-más. Y eso está bien.
Si eres un trabajador del conocimiento ahogándote en investigación, informes y presentaciones, GPT 5.4 acaba de ahorrarte diez horas por semana. Si eres un desarrollador buscando un mejor asistente de codificación, Opus 4.6 sigue siendo tu respuesta. Si eres un creador de contenido que necesita IA que realmente suene como tú, Claude gana esa carrera por un margen cómodo.
Las personas que están ganando una ventaja competitiva real con la IA ahora mismo no son las que debaten qué modelo es "el mejor." Son las que descubrieron qué modelo es el mejor para cada cosa específica que hacen — y construyeron flujos de trabajo que dirigen en consecuencia.
GPT 5.4 Thinking se ganó un lugar permanente en mi kit de herramientas hoy. No como reemplazo de nada. Como adición. Y honestamente, ese es el mayor cumplido que puedo darle a cualquier modelo de IA en 2026.
Trabajemos Juntos
¿Buscas construir sistemas de IA, automatizar flujos de trabajo o escalar tu infraestructura tecnológica? Me encantaría ayudar.
- Fiverr (desarrollo personalizado e integraciones): fiverr.com/s/EgxYmWD
- Portafolio: mejba.me
- Ramlit Limited (soluciones empresariales): ramlit.com
- ColorPark (diseño y branding): colorpark.io
- xCyberSecurity (servicios de seguridad): xcybersecurity.io