Review de Codeex: construí un sistema de IA para comentarios de YouTube

Casi ignoré Codeex. Otra aplicación AI de escritorio, otro conjunto de afirmaciones audaces sobre "automatizar todo su flujo de trabajo", otro contenedor GPT que pretende ser una plataforma. Tenía a Claude Code tarareando muy bien, los agentes haciendo un trabajo real y estaba inmerso en una implementación de Vercel cuando un amigo escribió una sola línea en Slack: "esta cosa simplemente me creó una aplicación funcional a partir de una hoja de cálculo, abrió mi navegador, lo implementó y programó un cron semanal, en un solo chat".

Cerré la pestaña de implementación y descargué la súper aplicación Codeex AI esa noche.

Once días después, había construido algo que había estado impulsando durante seis meses: un sistema de inteligencia de comentarios YouTube que extrae los últimos 200 comentarios de mi canal, los clasifica por señal, genera un libro de Excel de varias pestañas con gráficos, envía un panel de control localhost, lo implementa en una URL pública Vercel y actualiza todo cada lunes por la mañana mientras todavía estoy dormido. Sin guiones de pegamento. No copiar y pegar entre cinco herramientas. Una conversación, una carpeta de proyecto y una animación de mascota en la esquina de la ventana que me indica qué se estaba ejecutando en segundo plano.

Esta es la publicación que desearía que alguien me hubiera entregado antes de comenzar. Es un registro de compilación real, una revisión honesta y una comparación con Claude Code, porque la pregunta que seguía recibiendo de los lectores en mi bandeja de entrada no era "¿Codeex es bueno?" Fue "¿debo dejar Claude Code por esto?" La respuesta es más interesante que sí o no.

Por qué Codeex llamó mi atención cuando no estaba mirando

El tono de cada aplicación de escritorio AI suena igual. Todos prometen leer sus archivos, hacer clic en sus botones, escribir su código y, en general, reemplazar quince de sus herramientas con una ventana de chat. La mayoría de ellos colapsan al entrar en contacto con un flujo de trabajo real.

Lo que me atrajo hacia la súper aplicación Codeex AI fue una demostración específica que publicó un desarrollador en el que confío. Apuntó a Codeex a una carpeta de archivos CSV y le pidió que "me creara un panel, lo implementara y me enviara por correo electrónico un resumen semanal". El vídeo tenía dieciocho minutos de duración y no tenía cortes. En el minuto catorce, el panel estaba activo en una URL pública y se programó una tarea cron. No tocó su teclado durante los últimos seis minutos: Codeex estaba ejecutando acciones del navegador por sí solo, navegando por GitHub, Vercel y Gmail como un desarrollador junior que había estado en la empresa durante seis meses.

Ese tipo de autonomía ininterrumpida es poco común. El cursor es bueno codificando. Claude Code es excelente pensando. La mayoría de las aplicaciones de "agentes" se desmoronan en el momento en que tienen que salir del IDE y tocar un navegador real o una hoja de cálculo real. Codeex no lo hizo. Así que despejé un fin de semana y lo probé de la misma manera que pruebo todas las herramientas que cubro aquí: construyendo algo que realmente necesitaba, desde cero, sin permitir el rescate de otras herramientas.

Ese algo era el sistema de comentarios YouTube. Aquí está el truco que voy a desvelar desde el principio: en la hora tres, rompí la regla y abrí Claude Code de todos modos. Explicaré por qué más adelante y por qué ahora sigo corriendo ambos uno al lado del otro en lugar de elegir.

Qué es realmente Codeex cuando lo abres

Codeex es una aplicación de chat de escritorio que envuelve un agente impulsado por OpenAI (actualmente expone GPT 5.4 y GPT 5.5 en el modelo de alternancia) con un conjunto de capacidades que la mayoría de las aplicaciones de chat no tienen: acceso real a archivos locales, automatización del mouse y el teclado, navegación del navegador, control de aplicaciones y un sistema de recetas llamado Habilidades que puede invocar con comandos de barra diagonal. La interfaz es sencilla: la barra lateral izquierda contiene sus proyectos y chats, el panel derecho es la conversación y una barra superior le brinda la opción de alternar modelo más dos controles deslizantes.

Esos dos controles deslizantes importan más de lo que mencionan la mayoría de las reseñas. El primero es velocidad, el segundo es inteligencia. La inteligencia tiene cuatro niveles nombrados: bajo, medio, alto y extra alto. Se asignan cuánta cadena de pensamiento quema el modelo antes de actuar. Low es rápido y tonto. Extra alto se sentará y pensará durante dos minutos antes de escribir un solo archivo. Llegaré a cuándo cada uno es correcto en el tutorial de compilación, porque elegir el nivel incorrecto es la principal razón por la que las personas publican quejas de "Codeex es demasiado lento" o "Codeex diseñó demasiado mi proyecto" en Discord.

Lo que me sorprendió el primer día fue la amplitud. Codeex no solo edita archivos. Va a:

Abra Excel y escriba en celdas específicas, genere gráficos, administre múltiples pestañas
Maneje su navegador de un extremo a otro: complete formularios, haga clic en botones, extraiga una página, verifique una implementación
Lea y escriba cualquier archivo en su máquina al que su usuario tenga acceso
Llame a complementos y API externos (algunos requieren que coloque su propia clave API en el .env.local del proyecto)
Ejecutar aplicaciones GUI reales, incluidos, curiosamente, videojuegos durante una de mis pruebas de estrés.
Ejecute una función de mascota en la esquina que se anima mientras se ejecutan las tareas en segundo plano, para que sepa realmente si todavía está viva.

Esto último suena complicado hasta que te quedas sentado mirando una ventana de chat durante noventa segundos preguntándote si el agente falló. La mascota animada es el indicador de "tareas en ejecución" que no sabía que necesitaba. Es pequeño, pero es el tipo de detalle que le indica que el equipo comprende lo que se siente al usar esta herramienta para el trabajo real.

La otra pieza que vale la pena entender antes de construir algo es el sistema de Habilidades. Una habilidad en Codeex es una receta de rebajas, literalmente un archivo .md que describe un flujo de trabajo de varios pasos, qué herramientas necesita y qué forma debe tomar el resultado. Puede guardarlas como habilidades globales (disponibles en todos los proyectos) o habilidades locales (aplicadas a un proyecto). Los invocas con un comando de barra diagonal en el chat. Esto le resulta familiar si ha utilizado habilidades de agente en Claude Code, y debería hacerlo: el patrón es el mismo, la implementación simplemente tiene el sabor de OpenAI.

Esa convergencia es una de las cosas más interesantes que suceden en las herramientas de agentes en este momento: todos los jugadores serios aterrizan en la misma primitiva, que es una "pequeña receta de rebajas que le dice al modelo cómo comportarse para una tarea específica". Se está convirtiendo en un estándar, aunque alguien lo admita.

Codeex vs Claude Code vs Cloud Code: la comparación honesta

Tres herramientas, tres filosofías. Antes de mostrarles la construcción, aquí está el desglose que le daría a un amigo mientras tomamos un café:

Cloud Code (el producto de agente administrado y alojado de Anthropic) se ejecuta en Opus y Sonnet, vive en la nube y se basa en un trabajo supervisado de larga duración. Le das un gol, se dispara, vuelve con resultado. Lo mejor para tareas en las que desea una ejecución sin intervención en una caja remota.

Claude Code es la CLI local que la mayoría de los lectores ya conocen: Opus o Sonnet, controlada por terminal, conectada a su repositorio, con ganchos, habilidades y el SDK del agente. Es el que uso todo el día para trabajos con mucho código y el que uso de forma predeterminada cuando pensar importa más que hacer.

Codeex es una aplicación de escritorio GUI en los modelos de chat de OpenAI, optimizada para la ejecución práctica de múltiples herramientas con un fuerte sesgo hacia un comportamiento pragmático y práctico. Es lo más parecido que he usado a "una capa de sistema operativo para el trabajo de AI", lo que significa que no solo edita código, sino que opera su máquina.

Después de once días, este es el patrón en el que llegué:

Trabajo	Mejor herramienta	Por qué
Lluvia de ideas, decisiones arquitectónicas, "qué debo construir"	Claude Code	La profundidad del razonamiento de Opus aún está por delante para cuestiones de diseño ambiguas
Contenido de formato largo, diseño de mensajes complejos, redacción SEO	Claude Code	Mejor seguimiento de instrucciones sobre reglas estructurales y de voz sutiles
Ejecución de varios pasos que afecta a archivos, navegadores, API, implementaciones	Codeex	Bucles más estrechos, menos agarre de la mano, la automatización del navegador realmente funciona
Depurando una tubería atascada, "¿por qué no se ejecuta?"	Codeex	Pragmático, simplemente probaré cosas e informaré
Revisión de código y refactorización de una base de código existente	Claude Code	El conocimiento del contexto del repositorio es más nítido
Construyendo un nuevo proyecto desde una carpeta en blanco a una URL implementada	Codeex	La orquesta de principio a fin

ración es donde brilla |

Son complementarios, no competidores. Ahora mantengo Claude Code abierto en iTerm y Codeex abierto en el segundo monitor. Claude Code piensa, Codeex piensa. Cuando intenté que cualquiera de los dos hiciera ambos trabajos, perdí tiempo en ambas direcciones. Si desea tener una idea más profunda de dónde aún dominan las fortalezas de Claude Code, mi publicación de 32 trucos para usuarios avanzados de Claude Code cubre los movimientos que Codeex realmente no puede replicar.

Ahora construyamos.

La compilación: un sistema de inteligencia de comentarios YouTube, desde una carpeta vacía hasta una URL activa

El objetivo: extraer los últimos ~200 comentarios de mi canal, analizarlos, generar un informe de Excel estructurado con gráficos y pestañas, crear un panel de host local para la exploración en vivo, implementar ese panel en una URL pública Vercel y programar una actualización automática semanal que vuelva a ejecutar todo el proceso.

En Claude Code, planificaría esto como aproximadamente doce subtareas entre cuatro agentes. En Codeex, lo hice en un chat con ocho indicaciones. Aquí se explica exactamente cómo.

Paso 1: Configuración del proyecto y el archivo de incorporación de agentes.mmd

Creé una carpeta vacía en mi escritorio llamada youtube-comment-intel y la arrastré a Codeex como un nuevo proyecto. Lo primero que busca Codeex en la raíz de cualquier proyecto es un archivo de rebajas de incorporación. La convención es agents.mmd: un pequeño archivo que le dice al agente quién es, qué hace el proyecto, qué convenciones seguir y dónde se encuentran los archivos importantes.

La mía empezó con cinco líneas:

Goal: pull recent comments from YouTube channel UC..., analyze sentiment
and topics, output Excel report + dashboard, deploy weekly.

API keys live in .env.local
Source code lives in /src
Output reports live in /reports

Codeex léelo antes de hacer cualquier otra cosa. Vale la pena detenerse en eso: la mayoría de las aplicaciones de escritorio AI seguirán adelante con sus propias suposiciones. Codeex busca activamente el archivo agents.mmd de la misma manera que Claude Code busca CLAUDE.md. Si trata los archivos de su proyecto como el sistema operativo AI (es decir, las rebajas, los archivos env y la estructura de carpetas son la fuente de verdad que cualquier herramienta AI puede leer), su trabajo se vuelve portátil entre herramientas en lugar de estar bloqueado en una sola.

Esta es la mejor práctica más subestimada que he internalizado en los últimos seis meses. Claude Code podía leer el agents.mmd de mi proyecto YouTube sin modificaciones cuando más tarde abrí la misma carpeta en iTerm. Los archivos de habilidades que escribí en Codeex fueron reutilizables en un 90% en Claude Code con pequeños ajustes de formato. Esa portabilidad solo ocurre si te comprometes con los archivos del proyecto como sistema operativo desde el primer día.

Paso 2: Adquisición de datos con YouTube Datos API v3

Siguiente mensaje: "Configurar el acceso a datos YouTube API v3. Necesitamos extraer los últimos 200 comentarios de mi canal. Guíame para obtener la clave y luego escribe el script de recuperación".

Nivel de inteligencia en este: medio. El trabajo de planificación no necesita niveles muy elevados: necesita que el modelo piense con claridad, no de forma exhaustiva.

Codeex me guió paso a paso a través del flujo de Google Cloud Console: crear un proyecto, habilitar YouTube Datos API v3, generar una clave API, restringirla a ese API. Me abrió las pestañas del navegador usando la automatización del navegador. Hice clic, copié la clave y Codeex la escribió directamente en .env.local sin mostrar el valor bruto en el chat (un pequeño toque de seguridad que noté y aprecié).

Luego escribió el script de búsqueda. Nodo, axios, llamadas paginadas a commentThreads.list con part=snippet,replies&maxResults=100, dos pases para alcanzar ~200, JSON sin procesar volcado a /data/comments-raw.json. La primera ejecución obtuvo 197 comentarios. Hecho en menos de tres minutos, desde "configuremos API" hasta "tenemos datos".

Aquí es donde Codeex comienza a adelantarse a las herramientas de chat puro. La automatización del navegador no es una demostración, sino que soporta una carga. El agente navegó por console.cloud.google.com, hizo clic en tres cuadros de diálogo modales y verificó que la clave estaba activa presionando API una vez antes de colocarla en .env.local. He visto a Cursor intentar esto y fallar. He visto a Claude Code intentar esto y pedirme que lo haga manualmente. Codeex acaba de hacerlo.

Paso 3: Elegir el nivel de inteligencia adecuado para el trabajo adecuado

Antes del siguiente paso, quiero reducir la velocidad en la configuración del control deslizante, porque aquí es donde la mayoría de las revisiones de Codeex salen mal.

Una mayor inteligencia no siempre es mejor. En niveles muy altos, el agente gastará más tokens, tomará más tiempo y, esta es la clave, a veces realizará demasiada ingeniería. Una vez le pedí en extra-high que "escribiera un script rápido para eliminar duplicados de esta lista de comentarios". Me proporcionó un módulo de 180 líneas con clases de error personalizadas, un registrador, lógica de reintento y una interfaz CLI. Para un guión de treinta líneas.

El patrón que funciona:

Bajo/medio para planificación, intercambio de ideas, ediciones simples de archivos, "¿cómo debería nombrar esta columna?"
Alto para construcciones reales donde la corrección importa
Extra alto para depurar fallos extraños, refactorizaciones complejas y cualquier cosa en la que desee que el modelo piense realmente detenidamente.

Cambié entre estos constantemente durante la construcción. Planifique a nivel medio, construya a nivel alto, depure a nivel extra alto. Si deja el control deslizante en muy alto todo el día, quemará tokens, alcanzará los límites de contexto más rápido y verá cómo funciona la placa dorada del agente que no lo necesitaba.

La gestión de tokens y ventanas de contexto es la otra pieza que nadie menciona. GPT 5.5 tiene una ventana de contexto generosa, pero no es infinita, y una vez que tienes tres mil líneas de profundidad en un solo chat, la recuperación comienza a fallar. Aprendí a iniciar un chat nuevo para cada fase importante del proyecto (datos, análisis, panel, implementación) manteniendo la misma carpeta del proyecto. Codeex conserva el contexto del proyecto (contenido del archivo, agents.mmd, habilidades anteriores) en todos los chats. El historial de chat es sólo la memoria de trabajo de una fase, no la fuente de la verdad.

Paso 4: El producto de Excel que me hizo creyente

La parte divertida. Mensaje: "Tome los comentarios sin procesar, ejecute agrupación de opiniones y temas sobre ellos y constrúyame un libro de Excel con estas pestañas: Ideas del creador, Preguntas frecuentes, Ideas de contenido, Datos sin procesar. Agregue un gráfico circular para las opiniones y un gráfico de barras para la frecuencia de los temas en la pestaña Insights".

Inteligencia: alta.

Codeex se puso a trabajar. Escribió un script Python usando pandas y openpyxl, clasificó cada comentario en un grupo de temas (seleccionó siete grupos automáticamente: "solicitudes de tutoriales", "preguntas sobre herramientas", "debate", "agradecimiento", "quejas", "fuera de tema", "spam"), asignó una puntuación de sentimiento y generó el libro de trabajo.

Luego hizo algo que no pedí y que me alegró: abrió el archivo de Excel usando la automatización GUI, verificó cada pestaña representada correctamente, tomó una captura de pantalla del gráfico circular y colocó la captura de pantalla en el chat como prueba de cordura. "Así es como se ve la pestaña Insights: confirme que coincide con sus expectativas antes de continuar". Ese es el tipo de paso de autoverificación que Claude Code puede realizar, pero que normalmente hay que indicarle que lo haga. Codeex lo utiliza de forma predeterminada.

El libro de trabajo tenía señal real. La pestaña Preguntas frecuentes aparecían tres preguntas que había recibido repetidamente y que nunca había notado porque estaban enterradas en un flujo de comentarios en el que rara vez me desplazo. La pestaña Ideas de contenido sacó doce temas de video genuinos de los comentarios "Me gustaría que cubrieras X". La pestaña Creator Insights mostró que el sentimiento había aumentado un 14% en los últimos treinta días en comparación con los treinta anteriores.

Este es el momento en que dejé de pensar en Codeex como "otro contenedor GPT" y comencé a pensar en él como una herramienta real. No solo procesaba datos: producía algo por lo que le habría pagado a un profesional independiente 300 dólares para que lo construyera, en once minutos, y era dueño de cada línea del código.

Paso 5: Convertir el flujo de trabajo en una habilidad reutilizable

Una vez que la generación del libro funcionó, quería convertir todo el proceso en una habilidad reutilizable para poder activar el mismo análisis el próximo mes con un comando de barra diagonal.

Mensaje: "Convierta este flujo de trabajo (obtenga comentarios, ejecute análisis, genere Excel) en una habilidad Codeex llamada /analyze-channel. Guárdela como una habilidad global para poder usarla también en otros canales".

Codeex generó un archivo Skill de rebajas que capturó todo el flujo: entradas requeridas (ID de canal, ubicación de la clave API), dependencias de herramientas (axios, pandas, openpyxl), la plantilla de solicitud que impulsa el agente y la forma de salida esperada. Lo guardé en el directorio global de Habilidades.

Lo probé en un canal diferente (escribí /analyze-channel UC... con el ID del canal de un amigo) y todo el proceso se ejecutó desde cero en ocho minutos. Sin volver a solicitar, sin depurar, sin copiar y pegar código de un chat a otro.

El sistema de habilidades es lo que hace que Codeex se complique con el tiempo. La primera compilación es lenta porque estás descubriendo el flujo de trabajo. La segunda vez, es un comando de barra diagonal. En el décimo proyecto que haya creado, tendrá un conjunto de herramientas personal de /analyze-channel, /deploy-to-vercel, /refresh-dashboard, /audit-seo que invocará sin pensar. Este es el mismo efecto compuesto que hizo que el sistema de habilidades de Claude Code me desbloqueara la productividad el año pasado.

Lo global versus lo local importa más de lo que la gente cree. Las habilidades globales son ayudantes universales: /deploy-to-vercel, /init-nextjs-project, /clean-csv. Las habilidades locales son específicas del proyecto: /refresh-youtube-comments vive solo en este proyecto porque el ID del canal, la clave API y el formato de salida tienen forma de proyecto. No coloque habilidades específicas del proyecto en la carpeta global. Contaminarán cada chat y confundirán al agente para que intente usarlos donde no aplican.

Paso 6: Creación del panel con la imagen 2 de GPT para los conceptos UI

Siguiente mensaje: "Constrúyame un panel que visualice estos datos en vivo. Ejecútelo en localhost. Utilice Next.js. Genere un logotipo y una ilustración principal con GPT Image 2 para UI".

Inteligencia: alta con un breve aumento a extra alta cuando tuvo que depurar un problema de configuración de Tailwind.

Codeex creó un proyecto Next.js 15, generó el diseño, usó su complemento GPT Image 2 para crear un logotipo (una burbuja de comentarios estilizada cruzada con un ícono de gráfico, sorprendentemente limpia) y una ilustración principal. Escribió los enlaces de carga de datos que leen desde el mismo /data/comments-raw.json que escribe el script de análisis. Creó cuatro componentes del gráfico (círculo de opiniones, barra de temas, línea de serie temporal para el volumen de comentarios, tabla de preguntas principales) y los conectó.

Luego pasó el control de calidad con la automatización del navegador. Abrió localhost:3000, se desplazó, hizo clic en el filtro de cada gráfico, verificó los estados de desplazamiento, tomó capturas de pantalla y las colocó en el chat. "El panel se representa correctamente. Un error: el menú desplegable del filtro de temas se desborda en anchos de dispositivos móviles inferiores a 375 px. ¿Quieres que lo solucione?"

Sí lo hice. Lo arregló. Verificado nuevamente. Hecho.

La automatización del navegador aquí es realmente mejor que cualquier otra herramienta que haya probado. He usado Dramaturgo. He utilizado el uso del navegador. He usado las configuraciones sin cabeza que Claude Code puede manejar a través de MCP. La capa de navegador de Codeex es más rápida, más confiable en páginas inestables y, esto es lo mejor, se recupera de los errores. Cuando una página no se cargaba en el primer intento, no bloqueaba toda la cadena. Lo volvió a intentar, esperó más y continuó.

Paso 7: Repositorio privado de GitHub para implementación automática de Vercel

Mensaje: "Envíe esto a un nuevo repositorio privado GitHub y luego impleméntelo en Vercel".

No había configurado nada en GitHub o Vercel para este proyecto. Codeex hizo todo el flujo:

Git inicializado, realizó la primera confirmación con un mensaje de confirmación convencional limpio.
Utilicé el complemento GitHub (tuve que colocar un token de acceso personal en .env.local una vez, solo la primera vez) para crear un nuevo repositorio privado.
Empujó el código, configuró el control remoto
Usé el complemento Vercel para importar el repositorio, configuré la compilación (detectó automáticamente Next.js), establecí variables de entorno desde .env.local
Desencadenó el primer despliegue.
Supervisó los registros de implementación en tiempo real y publicó la URL en vivo cuando finalizó.

Tiempo total desde "enviar esto a GitHub" hasta "aquí está tu URL activa": cuatro minutos y doce segundos. El tablero estaba en vivo. El repositorio era privado. Las variables de entorno se configuraron correctamente.

Este es el flujo de trabajo que solía hacer manualmente para cada proyecto paralelo, y me costó cuarenta y cinco minutos haciendo clic en las pestañas cada vez. Ahora es un mensaje.

Paso 8: La automatización semanal que cierra el círculo

La pieza final: programar una actualización semanal que extraiga nuevos comentarios, regenere el informe de Excel, vuelva a implementar el panel con datos nuevos y envíe todo a GitHub.

Mensaje: "Programe un trabajo para ejecutar toda esta canalización todos los lunes a las 6 a. m.. Obtenga nuevos comentarios, actualice Excel, actualice los datos del panel, confirme cambios en GitHub, active una redistribución de Vercel. Notifiqueme cuando finalice".

Inteligencia: extra alta para este caso, porque la programación es el tipo de cosas en las que un error significa una tubería silenciosamente rota.

Codeex configura una entrada cron local que activa Codeex el lunes a las 6 a.m., abre el proyecto, ejecuta la habilidad /analyze-channel, luego se encadena a una habilidad /refresh-dashboard que generó sobre la marcha, confirma los archivos de datos con un mensaje con marca de tiempo, envía a GitHub (que activa automáticamente un Vercel se vuelve a implementar debido a la integración de GitHub) y me envía una notificación de Slack cuando se completa.

También me hizo una pregunta que aprecié: "¿Debería ejecutarse en modo de revisión automática, donde cada paso se detiene para su aprobación, o en modo de acceso completo, donde se ejecuta de un extremo a otro sin confirmación?" Elegí la revisión automática durante las primeras tres semanas y después el acceso completo.

Este modelo de permiso es una de las partes de Codeex en las que más confío. Los permisos predeterminados requieren aprobación para cualquier cosa destructiva: escritura de archivos, llamadas de red, confirmaciones de git, implementaciones. El modo de acceso total omite esa verificación. Utilice el acceso completo con cuidado. Solo lo habilito en flujos de trabajo que ya he supervisado durante tres o cuatro ciclos. La primera vez que le da a un agente acceso sin restricciones a su máquina, descubre rápidamente si confía en sus indicaciones tanto como cree.

Lo que Codeex hace mal

Te debo la parte honesta de esta reseña.

Codeex realiza demasiada ingeniería cuando no administra el control deslizante de inteligencia. Mencioné esto antes. Déjelo en muy alto todo el día y el agente le escribirá un microservicio cuando solicite una función. Preste atención al control deslizante.

La ventana de contexto del chat es generosa pero no infinita. En sesiones largas, la recuperación comienza a superar la marca de 200.000 tokens. La solución es iniciar nuevos chats por fase y confiar en los archivos del proyecto como fuente de verdad. Si tratas el chat como si fuera tu recuerdo, te morderán.

Algunos complementos necesitan claves API manuales. La primera acción GitHub, la primera implementación de Vercel, la primera generación de imágenes OpenAI; cada una requirió que colocara una clave en .env.local. Esta es una higiene de seguridad correcta, pero la incorporación podría revelarla más claramente. Perdí veinte minutos en el primer envío de GitHub porque no recibí el mensaje que pedía el token.

La animación de la mascota es realmente útil, pero mataría por un panel de registro de "¿qué está haciendo el agente en este momento?". La mascota me dice que algo está sucediendo. No me dice en qué paso de la cadena. Para canalizaciones de larga duración, quiero un árbol de tareas visible. La solución más cercana: solicite a Codeex que imprima el estado paso a paso para chatear. Funciona pero añade ruido.

El precio actualmente es OpenAI-economics. Los costos de los tokens GPT 5.4 y 5.5 con inteligencia extra alta se suman si ejecuta docenas de sesiones al día. Un día pesado para mí en Codeex consume más que un día pesado en Claude Code bajo mi plan Anthropic. Vale la pena saberlo si eres sensible a los costos.

No es un reemplazo de Claude Code para trabajos de razonamiento con mucho código. Lo intenté. Perdí. Los dos son complementarios. No elijas uno y abandones el otro.

Las mejores prácticas con las que desearía haber comenzado

Once días después, aquí está el manual de instrucciones que le entregaría a mi yo pasado.

Trate los archivos de su proyecto como el sistema operativo AI. El agents.mmd, la estructura de carpetas, el .env.local y las habilidades son portátiles entre herramientas. Constrúyalos correctamente y podrá intercambiar entre Codeex, Claude Code y lo que venga después sin perder trabajo.

Planifique siempre primero en el modo de planificación. Codeex tiene un modo de planificación explícito en el que el agente describirá el trabajo completo antes de tocar nada. Úselo. Lluvia de ideas antes de ejecutar. Saltarse el modo de plan es la forma de terminar con un script de deduplicación de 180 líneas.

Elija el nivel de inteligencia deliberadamente. Medio para planificación, alto para compilaciones, extra alto para depuración. No lo estaciones.

Mantenga activados los permisos predeterminados hasta que haya supervisado el flujo de trabajo tres veces. Luego pase al modo de acceso completo solo para ese flujo de trabajo específico. Nunca a nivel global.

Escribe Habilidades para cualquier cosa que hagas dos veces. El beneficio compuesto es enorme. La segunda vez que necesite un flujo de trabajo, debería ser un comando de barra diagonal.

Ejecute Codeex y Claude Code en diferentes monitores. Utilice Claude Code para pensamiento y arquitectura. Utilice Codeex para ejecutar y orquestar. Son herramientas diferentes con diferentes puntos fuertes.

Utilice AI para analizar sus propios flujos de trabajo. Una vez que una habilidad se esté ejecutando sin problemas, solicite a Codeex que revise la rebaja de habilidades y sugiera mejoras. Es sorprendentemente bueno para encontrar pasos redundantes y casos extremos que tuvo que manejar ad hoc.

Preguntas frecuentes

¿Codeex es mejor que Claude Code?

Ninguno de los dos es estrictamente mejor: están diseñados para trabajos diferentes. Codeex gana en ejecución práctica de múltiples herramientas (navegadores, implementaciones, canales de archivos). Claude Code gana en razonamiento profundo, revisión de código y diseño de mensajes complejos. Corro ambos a diario. Para ver el análisis completo, consulte "Codeex frente a Claude Code frente a Cloud Code" más arriba.

¿Qué es agentes.mmd en Codeex?

agents.mmd es el archivo de rebajas de incorporación que Codeex lee desde la raíz de su proyecto. Le informa al agente el objetivo, las convenciones, las ubicaciones de los archivos y las restricciones del proyecto. Es el equivalente Codeex de CLAUDE.md y debería ser el primer archivo que escriba en cualquier proyecto nuevo.

¿Necesito una clave OpenAI API para usar Codeex?

Codeex utiliza los modelos GPT 5.4 y 5.5 de OpenAI a través de su propia suscripción, por lo que no necesita una clave OpenAI personal para el chat principal. Necesitará claves API independientes para complementos como GitHub, Vercel o YouTube Datos API, que van en el .env.local de su proyecto.

¿Cuál es la diferencia entre el modo de revisión automática y el modo de acceso completo?

El modo de revisión automática se detiene antes de cada acción destructiva (escritura, implementación, confirmación) para su aprobación. El modo de acceso total ejecuta todo el flujo de trabajo sin confirmación. Comience en revisión automática para cualquier automatización nueva. Gradúese al acceso completo solo después de supervisar tres ejecuciones exitosas.

¿Puede Codeex realmente automatizar las tareas del navegador de manera confiable?

Sí, la automatización del navegador es la más confiable que he probado en herramientas de agentes, incluidas las configuraciones basadas en Playwright y el uso del navegador. Se recupera de cargas de páginas fallidas, reintenta selectores defectuosos y verifica las acciones visualmente. Detalle en la sección de creación del panel anterior.

Qué haré a continuación

El sistema de comentarios YouTube se ejecuta todos los lunes a las 6 a.m. El panel de la URL pública Vercel se actualiza solo antes de que me despierte. El informe de Excel se encuentra en mi Drive con pestañas nuevas cada semana. No he tocado nada en nueve días.

Esa es la prueba que realizo en cada herramienta que cubro aquí: ¿se mantuvo construida? ¿O tuve que seguir rescatándolo? Codeex pasó. El proceso todavía funciona de manera limpia, los datos aún están actualizados y el costo de uno de mis flujos de trabajo de mayor apalancamiento acaba de caer a cero en mantenimiento continuo.

Esta es la parte con la que quiero que te sientes. Lo que hizo que este proyecto funcionara no fue Codeex por sí solo. Era Codeex más una carpeta de proyecto que traté como el sistema operativo, más habilidades que construí deliberadamente, más una disciplina en torno a niveles de inteligencia y permisos que me llevó cuatro intentos fallidos para aprender.

Si va a probar Codeex esta semana (y debería hacerlo), elija un flujo de trabajo que haya estado postergando durante meses porque el pegamento era demasiado tedioso. Open an empty folder. Escriba un agents.mmd de cinco líneas. Planifique en medio, construya en alto, depure en extra alto. Permanezca en revisión automática hasta que confíe en él. Guarde el flujo de trabajo como una habilidad. Entonces ve a elegir el siguiente.

La animación de la mascota te permitirá saber que está funcionando. La URL activa le permitirá saber que ya está hecho.

Trabajemos juntos

¿Quiere crear sistemas AI, automatizar flujos de trabajo o ampliar su infraestructura tecnológica? Me encantaría ayudar.

Fiverr (compilaciones e integraciones personalizadas): fiverr.com/s/EgxYmWD
Cartera: mejba.me
Ramlit Limited (soluciones empresariales): ramlit.com
ColorPark (diseño y marca): colorpark.io
xCyberSecurity (servicios de seguridad): xcybersecurity.io