Skip to main content
📝 Claude Code

Agentic OS en Claude Code: la arquitectura de tres capas

Deja de usar Claude Code como una máquina tragamonedas. El sistema operativo agente de tres capas (arquitectura, memoria Obsidian, panel) que ejecuta mi

32 min

Tiempo de lectura

6,360

Palabras

May 08, 2026

Publicado

Engr Mejba Ahmed

Escrito por

Engr Mejba Ahmed

Compartir Artículo

Agentic OS en Claude Code: la arquitectura de tres capas

Agentic OS en Claude Code: la construcción de tres capas

La mayoría de la gente usa Claude Code como una máquina tragamonedas.

Abra la terminal. Escriba un mensaje. Tira de la palanca. A veces obtienes una refactorización que funciona. A veces te encuentras con un muro de advertencias sobre rebajas. A veces obtienes la mitad de lo que pediste y una explicación cortés de por qué la otra mitad "no es aconsejable en este momento". Entonces vuelves a ejecutar el mensaje. Tira de nuevo. Tal vez modifique una palabra. Tira de nuevo.

Hice esto durante los primeros ocho meses que usé Claude Code. Me dije a mí mismo que era ingeniería rápida. No lo fue. Fue un juego de azar.

Lo que finalmente rompió el círculo fue una metodología que aprendí de un resumen en video sobre la construcción de un "SO agente" sobre Claude Code, y que luego le di forma a mi propia realidad desordenada de administrar cuatro marcas y enviar aproximadamente 250 publicaciones de formato largo a través del sistema este año. La metodología tiene tres capas: arquitectura, memoria y observabilidad. Palabras aburridas. Recompensa masiva.

Esta publicación es la versión de esa metodología que realmente uso, escrita desde el campo, con las primitivas Claude Code específicas que estoy ejecutando y las cosas que probé y que no sobrevivieron al contacto con el trabajo real. Si estás en la etapa de las máquinas tragamonedas y comienzas a sospechar que hay una manera mejor, estás en lo cierto. Aquí lo tienes.

El problema de las máquinas tragamonedas tiene un costo

Antes de que la metodología tenga sentido, el dolor tiene que ser específico. Así que déjame ser específico.

El flujo de trabajo de una máquina tragamonedas parece productivo. Estás en la terminal. Están sucediendo cosas. Se está generando código. Pero el trabajo detrás del trabajo (la parte en la que vuelves a explicar la voz de tu marca por undécima vez, pegas la misma estructura de carpetas en una sesión nueva, depuras un resultado que se desvía porque olvidaste mencionar la restricción que era obvia para ti pero invisible para el modelo) esa parte es invisible hasta que la mides.

Medí el mío en marzo. Durante una semana de sesiones de Claude Code, gasté aproximadamente el 35% de mis tokens de aviso en el contexto que ya le había dado al modelo en una sesión anterior. No el trabajo en sí. La configuración para el trabajo. Reglas de marca que había escrito en tres lugares. Rutas de carpetas que mostré el martes y las volví a mostrar el viernes. Restricciones de voz enterradas en CLAUDE.md en algún lugar que nunca me molesté en señalar.

Peor aún: la variación. Pídale a Claude Code que escriba una publicación en mejba.me el lunes y obtendrá una forma. Pregunte de la misma manera el viernes y obtendrá algo que se leerá como si hubiera sido escrito por una persona relacionada pero desconocida. Ese no es el modelo que se porta mal. Ese soy yo ejecutando un mensaje no estructurado contra un motor sin estado y sorprendiéndome de que la salida no sea estable.

La metodología del sistema operativo agente soluciona ambos problemas al detener el juego e iniciar la arquitectura. Tres capas, en orden de impacto: organizar lo que haces (arquitectura), recordar lo que has hecho (memoria), ver lo que está pasando (observabilidad).

Incluso si solo adoptas la primera capa, obtendrás la mayor parte del valor. Quiero ser honesto al respecto porque la tentación cuando lees sobre un sistema de tres capas es intentar construir los tres un sábado. No. Construye la capa uno. Vive en ello. Luego agrega el siguiente.

Entremos en ello.

Capa uno: Arquitectura: desde mensajes aleatorios hasta un organigrama real

La primera capa es la que me rompió el hábito de las máquinas tragamonedas. También es el que casi me salto porque suena menos técnico.

La idea es sencilla. Deja de pensar en Claude Code como un lugar donde escribes mensajes. Empiece a pensar en ella como una organización con departamentos, descripciones de puestos y procedimientos operativos estándar. Concretamente, eso significa organizar su trabajo en cuatro conceptos anidados:

  • Dominios: las áreas generales en las que realmente opera (creación de contenido, investigación, productividad, comunidad, seguridad)
  • Tareas: el trabajo recurrente que produce cada dominio (una publicación de blog, un escaneo de la competencia, una revisión de código, una auditoría de marca)
  • Habilidades: instrucciones codificadas y repetibles sobre cómo realizar bien una tarea específica
  • Automatizaciones: habilidades que se ejecutan con un disparador en lugar de esperar a que las invoques.

Esto no es abstracto. En Claude Code, cada uno de esos conceptos se asigna a una primitiva real. Las habilidades se guardan como archivos SKILL.md con contenido frontal YAML. Los subagentes viven como archivos de rebajas en .claude/agents/. Los comandos de barra diagonal se encuentran como archivos en .claude/commands/. Las automatizaciones son habilidades incluidas en un enlace (SessionStart, PostToolUse) o un activador programado a través del SDK del agente Claude. La plataforma ya está preparada para ello. Sólo tienes que usar la forma.

Cómo se ve realmente un dominio en mi configuración

Dirijo cuatro marcas (mejba.me, ramlit.com, colorpark.io, xcybersecurity.io) además de un dominio interno de "operaciones" para todo lo que cruza marcas. Entonces tengo cinco dominios. Cada dominio tiene entre tres y siete tareas que realizo de forma recurrente, y cada tarea tiene como máximo una habilidad adjunta.

Aquí está la estructura truncada en el disco:

~/projects/agentic-os/
├── CLAUDE.md                          # root config (more on this below)
├── .claude/
│   ├── settings.json                  # permissions + hooks
│   ├── agents/                        # subagents (one per role)
│   │   ├── aria.md                    # content engineer
│   │   ├── auditor.md                 # SEO + voice auditor
│   │   └── researcher.md              # WebSearch + summary specialist
│   ├── commands/                      # slash commands
│   │   ├── morning-scan.md
│   │   ├── post-from-video.md
│   │   └── brand-audit.md
│   └── skills/                        # repeatable instructions
│       ├── write-blog-post/SKILL.md
│       ├── extract-video-summary/SKILL.md
│       └── seo-pass/SKILL.md
└── vault/                             # memory layer (Obsidian)
    ├── raw/
    ├── wiki/
    └── output/

Esa es toda la arquitectura en un solo árbol. Sin herramientas inteligentes. Sin plataforma propietaria. Solo carpetas que Claude Code ya entiende de forma nativa.

Lo que hace que esto sea un organigrama y no solo una carpeta son las relaciones entre las piezas. El subagente aria.md lee la habilidad write-blog-post. El comando de barra diagonal morning-scan invoca el subagente researcher, que lee la habilidad extract-video-summary. Cada pieza hace una cosa. Ninguno de ellos se duplica entre sí. Cuando quiero cambiar la forma en que se escriben las publicaciones en mejba.me, edito un archivo, el write-blog-post/SKILL.md, y cada invocación en cada dominio hereda el cambio.

Ésa es la superpotencia aburrida. Una fuente de verdad para cada capacidad.

Una habilidad real, no de juguete.

Déjame mostrarte cómo se ve realmente una habilidad. Aquí hay una versión simplificada de la que uso para extraer resúmenes estructurados de transcripciones de videos antes de que se conviertan en publicaciones de blog:

---
name: extract-video-summary
description: Extract a structured summary from a video transcript or YouTube URL. Use when the user provides a video, transcript, or asks to "summarize this video" before writing a post.
---

You are extracting a structured summary that another agent will use as
source material for a blog post. The output must be:

1. **TLDR** — three sentences. The single most important takeaway.
2. **Key claims** — bullet list. One claim per bullet. No editorializing.
3. **Specific examples** — bullet list. Names, numbers, dates, tools.
4. **Quotes worth pulling** — direct quotes that would land in a blog.
5. **What the video gets wrong or oversimplifies** — be honest.

Rules:
- Do not soften claims. If the speaker said it, write it as they said it.
- If a claim is unverified, mark it `[unverified]` and move on.
- Save the result to `vault/raw/video-summaries/[slug].md` using
  the video title as the slug.

Eso es todo. Cuarenta líneas una vez que cuentas el formato. Cargado en Claude Code a través de la herramienta Skill, transforma un mensaje poco confiable de "resume esto para mí" en un proceso determinista. La misma forma cada vez. La misma ubicación del archivo cada vez. Los mismos agentes posteriores pueden leerlo sin comprobar qué formato apareció hoy.

La clave de una buena habilidad es lo que elimina, no lo que agrega. Una habilidad recibe una pregunta confusa y elimina la variación. Si te encuentras escribiendo una habilidad larga e inteligente, probablemente no hayas decidido cuál es realmente la tarea.

Automatizaciones: habilidades con un disparador

Una automatización es una habilidad que se ejecuta sin ti. En Claude Code, la forma más económica de conectar uno es mediante un gancho en settings.json. Un gancho SessionStart se activa cuando comienza una sesión Claude Code. Un gancho PostToolUse se dispara después de que finaliza una herramienta. Ambos están configurados en settings.json y están documentados en la referencia oficial de ganchos Claude Code.

Aquí está el escaneo de tendencias matutino que realizo. Está conectado como un comando de barra diagonal (/morning-scan) que activo manualmente la mayoría de los días, pero en los días que quiero que esté automatizado, el mismo comando se ejecuta desde un trabajo cron que simplemente se desembolsa en claude -p "/morning-scan":

---
name: morning-scan
description: Aggregate AI news, competitor moves, and trending topics into a single daily brief. Save to vault/raw/scans/YYYY-MM-DD.md.
---

# Morning Scan

Run this every weekday morning before I open the terminal.

1. Use WebSearch to pull the top 5 stories from each of:
   - Anthropic, OpenAI, Google AI launches in the last 24h
   - HackerNews top 10 (filter to AI/dev/agent topics)
   - r/ClaudeAI top posts of the day
2. For each story, write a 2-sentence summary. No fluff.
3. Flag anything that affects my multi-brand workflow:
   - Claude Code changelog → tag #claude-code-update
   - New AI tool launches → tag #stack-candidate
   - Security/CVE news → tag #xcyber-relevant
4. Save the brief to vault/raw/scans/YYYY-MM-DD.md.
5. If anything in the brief is post-worthy for mejba.me, add a
   line at the top: `POST CANDIDATE: [topic]`.

La habilidad es el qué. El trabajo cron es el desencadenante. Juntos son una automatización.

Para la versión más limpia, usaría el SDK del agente Claude para programar la ejecución mediante programación y publicar el resultado en un canal de Slack o en su propio panel. Finalmente construí esa versión. La versión slash-command-plus-cron me consiguió el 80% del valor en 30 minutos.

Cuando la automatización se convierte en una trampa

Sección honesta. Automaticé en exceso durante dos meses a principios de 2026. Construí catorce automatizaciones en las cuatro marcas. Ganchos que se activan en cada Edit, análisis programados cada dos horas, un gancho que confirma automáticamente cualquier archivo que Claude Code toque. Era hermoso en una pizarra. Fue un desastre en la práctica.

Se rompieron tres cosas. Primero, los ganchos lucharon entre sí. Un formateador PostToolUse siguió formateando archivos durante la edición y pasando en cascada a la siguiente llamada de herramienta. En segundo lugar, el costo se disparó: cada escaneo programado era una sesión Claude completa sin límite, y la factura en marzo fue casi el doble que la de febrero. En tercer lugar, el ruido. Catorce automatizaciones significaron catorce notificaciones de Slack por día, la mayoría de las cuales silencié, lo que desbarató todo el objetivo.

Lo reduje a cuatro automatizaciones. Exploración matutina. Limpieza de la bóveda al final del día. Auditoría semanal de voz de marca. Revisión mensual del stack. Todo lo demás se convirtió en un comando de barra que ejecuto cuando realmente lo quiero. La lección: la automatización es para cosas que ejecutarías de todos modos, no para cosas que desearías que alguien ejecutara.

Si estás empezando desde cero, desarrolla una habilidad, un comando de barra y cero automatizaciones. Úselos durante una semana. Añade lo siguiente sólo cuando hayas sentido la ausencia.

Cubrí la filosofía más amplia del diseño de habilidades en la inmersión profunda en Claude Code habilidades que las empresas pagan en 2026, y los patrones tácticos para mantener las habilidades baratas en la publicación de ahorro de tokens de habilidades de cavernícolas: vale la pena leer ambos antes de comenzar a codificar el suyo.

Esa es la capa uno. Dominios, tareas, habilidades, automatizaciones. Si deja de leer aquí y simplemente crea esto, ya estará por delante del 95 % de los usuarios de Claude Code. Las siguientes dos capas lo componen.

Capa dos: Memoria: la bóveda Obsidian y CLAUDE.md que la ejecuta

La capa uno organiza lo que haces. La capa dos le da a Claude Code un lugar para recordar lo que hizo.

Quiero tener cuidado aquí, porque la "memoria" es el concepto más diseñado en el ecosistema de agentes en este momento. Cada dos semanas, otra startup envía una "capa de memoria para Claude", que es, tras una inspección, una base de datos vectorial con un presupuesto de marketing. Para el 90% de los flujos de trabajo personales y de equipos pequeños, no es necesario. Necesita una carpeta de archivos de rebajas y un archivo de configuración que le indique a Claude Code lo que contiene.

El patrón que finalmente me hizo clic es el enfoque Karpathy LLM Wiki: Andrej Karpathy publicó su versión el 3 de abril de 2026 y pasé un fin de semana reconstruyendo la mía para que coincidiera. La forma son tres carpetas dentro de una bóveda Obsidian: raw/, wiki/, output/. Cada carpeta tiene un trabajo claro. El LLM es el bibliotecario y el autor. No hay una base de datos vectorial, ni incrustaciones, ni una estrategia de fragmentación.

Yo escribí sobre este enfoque en detalle en la publicación Karpathy Obsidian RAG: esa publicación es una inmersión profunda en por qué funciona. Esta sección trata sobre cómo se inserta en el sistema operativo agente como capa de memoria.

Las tres carpetas, y para qué sirve cada una

La bóveda es muy simple:

vault/
├── raw/                              # ingestion, no organization required
│   ├── video-summaries/
│   ├── scans/                        # morning-scan output lands here
│   ├── transcripts/
│   ├── research-clippings/           # Obsidian Web Clipper drops here
│   └── inbox/                        # everything else, sorted later
│
├── wiki/                             # codified knowledge, LLM-maintained
│   ├── index.md                      # master index, LLM-written
│   ├── claude-code/
│   │   ├── index.md
│   │   ├── skills.md
│   │   ├── hooks.md
│   │   └── agents.md
│   ├── brands/
│   │   ├── mejba-me-voice.md
│   │   ├── ramlit-positioning.md
│   │   └── colorpark-design-rules.md
│   └── ops/
│       ├── seo-rules.md
│       └── publishing-checklist.md
│
└── output/                           # final deliverables
    ├── posts/
    ├── briefs/
    └── decks/

raw/ es el vertedero. Todo lo que quiero que Claude Code sepa eventualmente sobre tierras aquí, sin clasificar. Transcripciones de vídeo. Recortes web (un clic a través del Web Clipper Obsidian). Resultados del escaneo diario. Notas de voz aleatorias que dicto mientras camino. La fricción de ingestión es intencionalmente cercana a cero, porque en el momento en que tengo que pensar en dónde archivar algo, dejo de archivarlo.

wiki/ es donde el LLM se gana la vida. En una programación recurrente (o bajo demanda mediante un comando de barra diagonal), Claude Code lee raw/, identifica material nuevo que no se ha integrado y actualiza la wiki. Escribe artículos al estilo de una enciclopedia. Mantiene el maestro index.md. Vincula conceptos relacionados utilizando [[wiki-style links]] que Obsidian representa de forma nativa. La wiki es la comprensión compilada por parte del LLM de todo lo que se encuentra en la bóveda, escrita en un formato que la próxima sesión pueda leer de manera eficiente.

output/ es la línea de meta. Las publicaciones finales del blog van aquí. Los resúmenes de los clientes van aquí. Las presentaciones para los próximos talleres van aquí. Cualquier cosa que haya sido entregada. La razón por la que esto tiene su propia carpeta es para que Claude Code pueda responder rápidamente "¿qué he enviado?" sin arrastrarse por el resto de la bóveda.

Esa es toda la capa de memoria. Tres carpetas. Reducción. Gratis. Portátil.

El CLAUDE.md a nivel de bóveda que lo une

El único archivo que hace que esta capa sea funcional es el CLAUDE.md en la raíz de la bóveda. Es la configuración la que le dice a Claude Code qué hay en las carpetas y cómo tratarlas. Sin él, Claude tiene que adivinar cada sesión. Con él, reduce sus tokens de configuración de contexto en aproximadamente un 70%.

Aquí está la estructura real mía, ligeramente redactada:

# CLAUDE.md — Configuración de la bóveda Agentic OS

## Purpose

Esta bóveda es la capa de memoria persistente para el sistema operativo agente. es
mantenido conjuntamente por mí y Claude Code. La bóveda tiene tres niveles superiores.
carpetas, cada una con una función específica.

## Roles de carpeta

### crudo/
Material fuente sin procesar. Trate esto como si fuera solo para ingestión.
- NO modifique archivos en formato raw/ excepto para agregar otros nuevos.
- NO utilice raw/ como fuente principal al responder preguntas.
  Siempre revisa wiki/primero, luego vuelve a raw/si el wiki
  tiene un hueco.
- Nuevo material de Obsidian Web Clipper, resúmenes en vídeo y
  La automatización del escaneo matutino llega aquí.

###wiki/
Conocimiento codificado, mantenido por Claude Code. Trate esto como el
fuente principal de verdad para todo lo que se ha procesado.
- Empiece siempre por aquí cuando responda una pregunta.
- Actualice siempre wiki/index.md cuando cree un nuevo artículo wiki.
- Utilice [[enlaces estilo wiki]] para hacer referencias cruzadas de conceptos relacionados.
- Si encuentra un espacio en la wiki mientras responde una pregunta, tenga en cuenta
  en la parte inferior del index.md relevante como TODO.

### salida/
Entregables finales. Trate esto como de lectura mayoritaria.
- Escriba aquí únicamente cuando se le solicite explícitamente producir un entregable.
- Al producir una nueva publicación, verifique salida/posts/ para asegurarse
  la babosa aún no está tomada.

## Reglas de flujo de trabajo

1. Cuando solicite una publicación de blog, lea la sección wiki correspondiente.
   primero, luego raw/ para cualquier material nuevo desde que se creó la wiki.
   actualizado por última vez, luego escriba el borrador en output/posts/[slug].md.
2. Cuando agrego material nuevo a raw/, no lo procese automáticamente.
   Espera a que ejecute /update-wiki.
3. Las reglas de voz de la marca se encuentran en wiki/brands/. Cargue siempre el
   relevante antes de escribir con la voz de esa marca.
4. Las reglas de SEO se encuentran en wiki/ops/seo-rules.md. Se aplican en cada publicación.

## Marcas activas
- mejba.me (personal, en primera persona, apasionado)
- ramlit.com (corporativo, de tercera persona, centrado en resultados)
- colorpark.io (diseño, obstinado, visual)
- xcybersecurity.io (seguridad, autorizado, urgente)

Ese archivo tiene quizás 60 líneas. Hace más por la coherencia de mis resultados que cualquier habilidad que haya escrito. La razón es simple: elimina las conjeturas. Claude Code no tiene que averiguar dónde viven las cosas, para qué sirve cada carpeta o cómo manejar solicitudes ambiguas. Las reglas están en el archivo, el archivo se carga en cada sesión y cada subagente hereda el contexto.

Si va a escribir un archivo de configuración para toda su configuración, escriba este.

Lo que probé primero y lo abandoné

Dos experimentos de memoria que no sobrevivieron al contacto con el trabajo real.

Primero: intenté almacenar memoria en una base de datos vectorial Supabase con un servidor MCP personalizado. Supabase como almacén de vectores, incrustaciones OpenAI, recuperación semántica de mis notas. Funcionó. También estaba excesivamente diseñado para lo que realmente necesitaba, que era "recordar lo que decidimos el martes pasado". La calidad de recuperación fue activamente peor que simplemente dejar que Claude Code leyera la rebaja directamente, porque los fragmentos se cortaban a mitad de la oración y las puntuaciones de similitud aparecían casi duplicadas en lugar de la nota más útil. Después de dos fines de semana de sintonización, lo borré todo.

Segundo: intenté que Claude Code procesara automáticamente cada nuevo archivo sin formato en el momento en que se agregaba: un gancho PostToolUse que activaría una actualización de la wiki con cada escritura en raw/. El coste fue brutal. Cada vez que recortaba un artículo largo, generaba una sesión que leía el artículo, decidía dónde encajaba en la wiki, a veces escribía un artículo nuevo y a veces actualizaba uno existente. Algunas de esas sesiones fueron de más de 30.000 tokens. Al hacer esto docenas de veces al día, se quemaron créditos sin generar un valor proporcional, porque la mayoría de los recortes no necesitan procesarse el mismo día en que se guardan.

La solución fue el comando explícito /update-wiki en CLAUDE.md arriba. Lo ejecuto una vez por semana, los domingos. Agrupa toda la materia prima sin procesar en una sola sesión y la relación costo por conocimiento se reduce aproximadamente 10 veces.

La lección: las capas de memoria fallan ya sea por sobrearquitectura (DB vectoriales) o por exceso de entusiasmo (procesamiento automático de cada entrada). La estructura de carpetas de Karpathy más un CLAUDE.md claro más un comando de actualización manual es el aburrido medio que realmente funciona.

Esa es la capa dos. Tres carpetas, un archivo de configuración, un hábito semanal. Ahora el sistema tiene continuidad.

Capa tres: observabilidad: un panel que expone el sistema operativo a los humanos

La capa uno organiza lo que haces. La capa dos recuerda lo que hiciste. La capa tres es la parte que importa cuando dejas de ser el único usuario.

Seré honesto: construí la capa tres al final y durante mucho tiempo pensé que no la necesitaba. Yo era el único operador. Vivía en la terminal. La terminal estaba bien. Luego traté de entregar la automatización del escaneo matutino a una compañera de equipo para poder irme de vacaciones por una semana, y todo el sistema colapsó no porque la tecnología fallara sino porque ella tuvo que aprender tres comandos CLI, una estructura de bóveda y la diferencia entre un comando de barra diagonal y un subagente antes de poder ejecutar un trabajo.

La terminal es un foso. Para mí es una característica. Para todos los demás, es un muro.

Un panel es la tercera capa de un sistema operativo agente porque es la capa que permite que el sistema atienda a las personas que no quieren ganarse la vida escribiendo claude -p "...". Eso incluye compañeros de equipo no técnicos, clientes, su futuro un domingo por la mañana cuando escribir parece trabajo y cualquiera que quiera ver qué está haciendo el sistema sin tener que buscar archivos de registro.

Qué hace realmente el panel

Todavía no existe un único panel oficial de Claude Code. A partir de mayo de 2026, Anthropic envía la pila de monitoreo Claude Code a través de OpenTelemetry, ocho métricas que incluyen recuento de sesiones, uso de tokens, costo estimado y tiempo activo, y un ecosistema saludable de capas de observabilidad creadas por la comunidad (el proyecto claude-code-otel es el que más he usado). Lo que nadie envía de fábrica es la superficie de control, la parte que expone tus habilidades y automatizaciones como botones.

Entonces construyes esa parte tú mismo. La forma que mejor me ha funcionado es una pequeña aplicación Next.js (quizás 600 líneas en total) que hace cuatro cosas:

  1. Expone cada habilidad y automatización como un botón en el que se puede hacer clic. Haga clic en "Escaneo matutino" y el panel se despliega en claude -p "/morning-scan" (o accede al SDK del agente Claude mediante programación). La salida regresa al UI. 2. Seguimiento del uso. ¿Cuándo se ejecutó cada habilidad por última vez? ¿Cuánto tiempo tomó? ¿Cuántas fichas costó? ¿Qué automatizaciones se han activado según lo previsto y cuáles han fallado silenciosamente? 3. Muestra los cambios recientes de la bóveda. ¿Qué se agregó a raw/ en las últimas 24 horas? ¿Qué cambió el último /update-wiki en wiki/? ¿Qué se publicó en output/posts/ esta semana? 4. Vincula cada salida nuevamente a Obsidian. Cada resultado que muestra el panel tiene un enlace "Ver código fuente" que abre el archivo de rebajas correspondiente en Obsidian.

Trazabilidad total: cada reclamo que muestra el sistema apunta al archivo del que proviene el reclamo.

Este último es el más importante. Sin él, el tablero se convierte en otra caja mágica donde AI hace cosas y usted confía en él. Con él, cada salida es auditable con un solo clic. Ves el resultado, haces clic en la fuente y estás leyendo la rebaja que leyó el agente. Ninguna alucinación puede ocultarse.

Lo que NO necesita hacer el panel

Quiero señalar esto porque me quedé un mes en ello. No es necesario que el tablero sea:

  • Una herramienta completa de gestión de proyectos. No es lineal. No reemplaza su rastreador de tareas. Es una superficie de control para su sistema operativo agente, punto.
  • Una plataforma de análisis. El seguimiento del gasto de tokens es útil. Un almacén de análisis personalizado no lo es.
  • Un SaaS multiinquilino. Si crea uno, dedicará tres meses a la autenticación y cero meses a mejoras reales en el flujo de trabajo.
  • Una herramienta de colaboración multiusuario en tiempo real. Eres el operador. El panel es para usted y tal vez para uno o dos colaboradores de confianza.

El panel que construí es una aplicación Next.js de una sola página con una ruta, sin autenticación (es solo para host local) y una instancia de Postgres para registros de uso. Tiempo total de construcción: unas 14 horas, repartidas en dos fines de semana. Hace las cuatro cosas anteriores. Nada más.

Las métricas que realmente importan

De las ocho métricas que Claude Code exporta de forma nativa, cuatro aparecen en la pantalla de inicio de mi panel:

  • Tokens gastados por habilidad, por semana. Esta es la métrica que detecta que las automatizaciones se vuelven deshonestas. La semana que disparé el gancho auto-wiki, este gráfico se multiplicó por 3 y pude ver exactamente qué habilidad era la responsable.
  • Recuento de ejecuciones por automatización. Qué automatizaciones realmente se ejecutan y cuáles dejé de usar silenciosamente. Si una automatización semanal no se activa en tres semanas, está muerta y la elimino.
  • Vault delta. Cuántos archivos cambiaron en raw/, wiki/, output/ esta semana. Esto es lo más parecido a "si el sistema realmente funciona" que he encontrado.
  • Marca de tiempo de la última ejecución por habilidad. ¿Cuándo invoqué esto por última vez? Las habilidades que no he ejecutado en 60 días se archivarán. El sistema debería ser un organismo vivo, no un museo.

Las otras cuatro métricas (recuento de relaciones públicas, líneas de código, decisiones de edición de código, tiempo activo) son útiles para los equipos de ingeniería, pero menos útiles para una operación de contenido. Su kilometraje variará dependiendo de cuáles sean sus dominios.

Lo que construiría si comenzara hoy

Si estuviera reconstruyendo el tablero desde cero en mayo de 2026, comenzaría con una de las pilas de observabilidad Claude Code de código abierto (Cole Murray's claude-code-otel más Grafana es una base sólida) y atornillaría la superficie de control encima. La parte de observabilidad se resuelve mediante trabajo comunitario. La superficie de control es la parte que tienes que escribir tú mismo, porque es específica de tus habilidades y automatizaciones.

No intentes construirlo todo en la primera semana. El tablero debe ser lo que recurra cuando ejecutar el sistema operativo en la terminal deja de parecer rápido. Si todavía estás contento con la terminal, no la necesitas todavía.

Esa es la capa tres. Una superficie de control que expone el sistema operativo a los humanos, con trazabilidad hasta la bóveda. Constrúyalo al final, constrúyalo en tamaño pequeño, constrúyalo para un solo usuario.

Cuándo toda esta estructura realmente da sus frutos

He estado escribiendo como si todo el mundo debería construir las tres capas. No deberían hacerlo. El sistema operativo agente vale la pena en situaciones específicas y es excesivo en otras. Evaluación honesta:

Construye las tres capas si:

  • Ejecutar más de una marca o un proyecto importante (la estructura se compone de cada uno)
  • Entregar el trabajo a compañeros de equipo, clientes o contratistas que no vivan en una terminal.
  • Producir entregables recurrentes según un cronograma (publicaciones de blog, resúmenes, auditorías, escaneos)
  • Te has sorprendido reexplicando lo mismo a Claude Code más de tres veces.

Construye solo la capa uno si:

  • Es un operador en solitario con un proyecto principal.
  • Utilice principalmente Claude Code para tareas de codificación puntuales.
  • Estás en tu primer mes de uso serio de Claude Code (dale tiempo antes de agregar arquitectura)

Sáltate todo si:

  • Utilice Claude Code ocasionalmente para proyectos personales sin resultados recurrentes
  • Todavía estás averiguando cuáles son tus dominios y tareas.
  • Quiere aprender la plataforma primero: sobreestructurar antes de comprender las primitivas es la segunda forma más rápida de abandonar la plataforma.

La razón por la que el sistema operativo me resulta rentable es que administro cuatro marcas y envío aproximadamente 250 publicaciones de formato largo al año. Sin la estructura, la variación me mata. Con la estructura, cada marca tiene una voz estable, cada publicación parte del mismo andamiaje y el tiempo por publicación cae de "una tarde completa" a "noventa minutos incluida la investigación". Ésa es la matemática que hace que valga la pena la sobrecarga arquitectónica.

Si tus cálculos son diferentes, la respuesta es diferente. Quiero asegurarme de no vender algo que nadie necesita.

Lo que me saltaría el primer día

Sigo preguntándome "¿por dónde empiezo?" y sigo dando la misma respuesta, así que déjame hacerlo explícito. Si lees esta publicación y decides crear un sistema operativo agente, esto es lo que debes hacer esta semana:

Día uno, solo esta semana. Elija un dominio. Sólo uno. Lo que haces con más frecuencia en Claude Code en este momento. Para mí, eso fue la creación de contenido. Para usted, podría ser una revisión de código, una investigación o un trabajo de diseño. Elige uno.

Dentro de ese dominio, identifica tres tareas. Las tres cosas que realmente haces de forma recurrente dentro de ese dominio. No tareas teóricas. Cosas que has hecho al menos cuatro veces en el último mes.

Escribe una habilidad por tarea. Usa el formato anterior. Cuarenta líneas como máximo. El objetivo es eliminar la variación, no ser inteligente. Guárdalos en .claude/skills/.

Escribe un solo CLAUDE.md. Un párrafo por tarea explicando lo que quieres y dónde debe ir el resultado. No es un libro. Una página.

Detente ahí.

No construyas la bóveda todavía. No construyas el tablero todavía. No construyas automatizaciones. Utilice la arquitectura durante dos semanas. Presta atención a dónde se rompe y dónde canta. Ajuste las habilidades en función de lo que aprenda del uso real.

Después de dos semanas, si la arquitectura se ha mantenido, empezarás a sentir la ausencia de memoria. Ahí es cuando construyes la bóveda. Después de dos semanas más, si estás trabajando con alguien más, empezarás a sentir la ausencia del panel. Ahí es cuando construyes el tablero.

El interés compuesto de este enfoque es que cada capa resuelve un problema que ya ha sentido. No estás construyendo infraestructura especulativa. Estás cerrando brechas que puedes nombrar.

Qué cambia esto sobre cómo usa Claude Code

El cambio más profundo que produce el sistema operativo agente no es táctico. Es psicológico.

Antes de tener esta estructura, sentía que cada sesión de Claude Code podía ir en cualquier dirección. Abría la terminal con una vaga intención, escribía algo y dejaba que el modelo hiciera lo que quisiera. La variación se sintió como creatividad. No lo fue. Fue aleatoriedad con buenas relaciones públicas.

Después de la estructura, cada sesión tiene una forma. Abro Claude Code sabiendo qué habilidad se va a ejecutar, qué subagente se encargará de ello, en qué carpeta llegará la salida y qué agente posterior la recogerá a continuación. La sesión se siente menos como una indicación y más como un envío. Ya no colaboro con una máquina tragamonedas. Estoy ejecutando un organigrama.

Ese cambio, más que cualquier herramienta o truco individual, es lo que hizo que Claude Code pasara de "herramienta interesante" a "sistema operativo" para mí. La metodología es lo que me llevó allí. Las tres capas son las que lo mantienen en su lugar.

Si estás en la etapa de las máquinas tragamonedas en este momento, esto es lo único que quiero que aprendas de esta publicación: la salida no es un mejor mensaje. Es una mejor arquitectura. Elija un dominio esta semana. Escribe tres habilidades. Escribe un CLAUDE.md. Deje de tirar de la palanca y comience a ejecutar la operación.

Estaré en la terminal, pero ya no juego.

Preguntas frecuentes

¿Qué es un sistema operativo agente en Claude Code?

Un sistema operativo agente es un marco estructurado que convierte a Claude Code de un aviso ad-hoc en un sistema en capas con tres capas: arquitectura (dominios, tareas, habilidades, automatizaciones), memoria (una bóveda Obsidian con carpetas sin formato, wiki y de salida, además de un CLAUDE.md a nivel de bóveda) y observabilidad (un panel que expone habilidades y automatizaciones como botones en los que se puede hacer clic con métricas de uso). Utiliza las primitivas nativas de Claude Code, como habilidades, subagentes, enlaces y comandos de barra diagonal, en lugar de herramientas personalizadas. Para ver el tutorial de implementación completo, consulte el desglose de tres capas anterior.

¿Necesito una bóveda Obsidian para usar Claude Code de manera efectiva?

No: Obsidian es una buena opción para la capa de memoria, no un requisito. La capa de bóveda es solo una carpeta de archivos de rebajas con un CLAUDE.md de nivel de bóveda que le dice a Claude Code para qué sirve cada carpeta. Puedes implementar la misma estructura en cualquier carpeta simple; Obsidian agrega visualización gratuita para humanos, enlaces estilo wiki y Web Clipper para ingesta.

¿En qué se diferencia una habilidad Claude Code de un comando de barra diagonal?

Una habilidad es un archivo SKILL.md con contenido YAML que describe una tarea repetible y se carga automáticamente cuando es relevante. Un comando de barra diagonal es un archivo de rebajas en .claude/commands/ que se invoca explícitamente con /command-name. Las habilidades tienen que ver con capacidad; Los comandos de barra diagonal tratan sobre invocación. La mayoría de los sistemas bien construidos tienen habilidades que se activan mediante comandos de barra diagonal.

¿Qué es una automatización Claude Code y cómo creo una?

Una automatización es una habilidad que se ejecuta con un disparador en lugar de esperar a que la invoques. La forma más económica de conectar uno es a través de un gancho en .claude/settings.json: un gancho SessionStart o PostToolUse que activa el comando de barra correspondiente. Para automatizaciones programadas, un trabajo cron que se desembolsa en claude -p "/your-command" funciona bien. El SDK del agente Claude proporciona una versión programática cuando se le queda pequeño.

¿Cuánto cuesta ejecutar un sistema operativo agente en Claude Code?

La capa uno (arquitectura) no cuesta nada adicional; de todos modos, estás pagando por Claude Code. La capa dos (bóveda) es gratuita si usa Obsidian. La capa tres (panel de control) es solo el costo de alojamiento, generalmente menos de $10/month para una configuración de un solo operador. El costo variable proviene de las automatizaciones: una automatización mal ajustada puede duplicar su gasto en tokens, por lo que limito las automatizaciones a cuatro y reviso las métricas de tokens por habilidad semanalmente.

¿Puedo entregar un sistema operativo agente a un compañero de equipo no técnico?

Esto es exactamente para lo que está construida la capa tres (el tablero). La terminal es un foso para los operadores técnicos y un muro para todos los demás. Un panel que expone habilidades y automatizaciones como botones, con salida transmitida al UI y enlaces de origen nuevamente al Obsidian, permite que un compañero de equipo sin conocimientos técnicos ejecute el sistema sin siquiera tocar el CLI. Sin el tablero, el traspaso es doloroso.

Trabajemos juntos

¿Quiere crear sistemas AI, automatizar flujos de trabajo o ampliar su infraestructura tecnológica? Me encantaría ayudar.

Coffee cup

¿Te gustó este artículo?

Tu apoyo me ayuda a crear más contenido técnico detallado, herramientas de código abierto y recursos gratuitos para la comunidad de desarrolladores.

Temas Relacionados

Engr Mejba Ahmed

Sobre el Autor

Engr Mejba Ahmed

Engr. Mejba Ahmed builds AI-powered applications and secure cloud systems for businesses worldwide. With 10+ years shipping production software in Laravel, Python, and AWS, he's helped companies automate workflows, reduce infrastructure costs, and scale without security headaches. He writes about practical AI integration, cloud architecture, and developer productivity.

Discussion

Comments

0

No comments yet

Be the first to share your thoughts

Leave a Comment

Your email won't be published

5  x  4  =  ?

Seguir Aprendiendo

Artículos Relacionados

Ver Todos

Comments

Leave a Comment

Comments are moderated before appearing.

Learning Resources

Expand Your Knowledge

Accelerate your growth with structured courses, verified certificates, interactive flashcards, and production-ready AI agent skills.

Sample Certificate of Completion

Sample certificate — complete any course to earn yours

Engr Mejba Ahmed

Engr Mejba Ahmed

Claude Code Expert · Online

👋

Hey there!

Quick Actions

WhatsApp Instant reply

Chat on WhatsApp

+880 1723 741224 · Instant reply

Popular Questions

Engr Mejba Ahmed is connected
Engr Mejba Ahmed is typing...
Engr Mejba Ahmed avatar

✉ Want me to follow up? Drop your email

Engr Mejba Ahmed avatar

📞 Connect Directly

Choose how you'd like to reach me

WhatsApp

+880 1723 741224

Email

[email protected]

✓ Details sent! I'll get back to you shortly.

Powered by OpenAI

335+

Blog Posts

25

AI Courses

63

Projects

Services & Expertise

Pricing & Process

Learning & Resources

Connect & Support