OpenClaw y Hermes Agent: El sistema de dos agentes que uso a diario
Mi instancia de OpenClaw se estrelló a las 11:43 p.m. de un miércoles. No fue una falla elegante: un fallo total después de que una actualización empujara una configuración de clave API rota que invalidó silenciosamente todas las sesiones activas. Había estado ejecutando una canalización de contenido que estaba a mitad de proceso. Tres artículos en cola, investigación recopilada, esquemas redactados. Todo quedó congelado en un proceso muerto.
Hace seis meses, ese fallo me habría costado toda una mañana de recuperación. Reconectar sesiones, volver a alimentar el contexto, reiniciar la canalización desde cero. He pasado por ese ciclo suficientes veces como para conocer exactamente el tipo de frustración que produce: esa en la que no te enfadas con la herramienta, sino contigo mismo por confiar en un único punto de fallo.
Pero esta vez, ocurrió algo diferente. A los cuatro segundos de que OpenClaw se apagara, mi agente Hermes detectó el fallo. Inspeccionó los registros de errores, identificó la configuración rota de la clave API, parcheó el archivo de configuración y reinició el proceso de OpenClaw. Para cuando revisé mi teléfono tras escuchar la notificación de Telegram, la canalización ya estaba funcionando de nuevo. Tiempo total de inactividad: once segundos.
Ese momento —ver a un agente de IA diagnosticar y reparar a otro agente de IA mientras yo no hacía nada— cambió fundamentalmente mi forma de pensar sobre cómo construir flujos de trabajo con IA. No porque la tecnología fuera nueva, sino porque finalmente la había configurado correctamente. Dos agentes, fortalezas complementarias, trabajando como una unidad en lugar de operar de forma aislada.
Este es el sistema que voy a desglosar para ti. No la teoría de los flujos de trabajo multiagente, sino la implementación real que ejecuto cada día, incluyendo los cuatro patrones de flujo de trabajo específicos que hacen que OpenClaw y Hermes sean mucho más potentes juntos que cualquiera de los dos por separado.
Pero antes, necesitas entender por qué estas dos herramientas específicamente, y por qué la combinación importa más que las capacidades individuales de cada una.
Por qué dos agentes superan a uno — Y por qué estos dos en particular
He probado configuraciones multiagente antes. Escribí sobre la configuración de equipos multiagente de OpenClaw hace meses, y la conclusión de esa experiencia fue clara: ejecutar múltiples instancias del mismo agente genera una sobrecarga de coordinación que a menudo anula las ganancias de productividad. Cuatro agentes OpenClaw haciendo trabajos distintos siguen compartiendo los mismos modos de fallo, los mismos ciclos de actualización y las mismas dependencias de modelo.
La combinación OpenClaw-Hermes funciona porque estas dos herramientas fueron creadas con filosofías de diseño fundamentalmente diferentes, y esas diferencias resultan ser complementarias de formas que importan en la práctica — no solo a nivel arquitectónico.
OpenClaw es una herramienta gateway-first. Envuelve un agente alrededor de una infraestructura de mensajería. Conéctalo a Slack, Telegram, Discord, SMS — no le importa. Gestiona la orquestación multicanal, la programación, bibliotecas de habilidades (más de 44,000 a partir de la actualización de abril de 2026) y la gestión persistente de sesiones. Cuando necesito un agente que planifique tareas complejas, coordine entre plataformas y mantenga sesiones de larga duración, OpenClaw es mi elección. Es el gestor de proyectos de mi stack de IA.
Hermes es una herramienta agent-first. Desarrollada por Nous Research y lanzada en febrero de 2026, envuelve un gateway alrededor de un agente de aprendizaje. El diferenciador clave es lo que Hermes llama su learning loop: ejecutar, evaluar, extraer, refinar, recuperar. Cada tarea que Hermes completa se evalúa frente a su propio resultado, los patrones útiles se extraen como habilidades reutilizables y esas habilidades se refinan con el uso repetido. El agente literalmente mejora en las tareas cuanto más las realiza.
Esa distinción — gateway-first frente a agent-first — crea una división natural del trabajo. OpenClaw destaca en la orquestación de alto nivel: decidir qué debe suceder, cuándo y en qué orden. Hermes sobresale en la ejecución: realizar la tarea concreta de forma rápida, económica y con una calidad que mejora con el tiempo.
Aquí también hay una dimensión de costes, y es significativa. OpenClaw funciona mejor con modelos de alta capacidad. Uso Opus 4.6 para mi instancia principal de OpenClaw porque las tareas de planificación y revisión exigen un razonamiento sólido. Eso es costoso — los costes por token en Opus se acumulan rápido cuando ejecutas sesiones persistentes. Hermes, en cambio, funciona bien con modelos más ligeros. El mío lo ejecuto en el plan de $20 de ChatGPT para la mayoría de tareas, y para algunos procesos por lotes uso GLM-5, que cuesta una fracción de lo que cobra Opus.
El resultado: obtengo planificación y revisión de calidad a nivel Opus en las tareas que lo requieren, con ejecución económica en todo lo demás. Mi gasto total en IA se redujo aproximadamente un 40% tras pasar de una configuración solo-OpenClaw al sistema combinado — mientras que mi rendimiento real aumentó.
Esa es la teoría. Así es como se ve en la práctica, empezando por el flujo de trabajo que me salvó la noche del miércoles.
Flujo de trabajo 1: El sistema de respaldo que eliminó mis tiempos de inactividad
OpenClaw se actualiza con frecuencia. Dolorosamente frecuente. El equipo de desarrollo lanza mejoras a un ritmo que sería admirable si cada actualización no llevara consigo una probabilidad nada trivial de romper algo. Solo en febrero de 2026, el repositorio alcanzó las 100,000 estrellas en GitHub en parte porque la herramienta es realmente potente — pero el ciclo de actualizaciones significa que “realmente potente” viene acompañado de “a veces se rompe en los momentos más inoportunos”.
Antes de emparejarlo con Hermes, un fallo de OpenClaw implicaba recuperación manual. Hacer SSH al Mac Mini, leer los registros, identificar el problema, aplicar la solución, reiniciar el proceso. En el mejor de los casos: quince minutos. En el peor: una hora depurando algún conflicto de configuración oscuro introducido por la última actualización.
El flujo de respaldo es elegante en su simplicidad. Hermes ejecuta una comprobación de salud ligera contra el proceso de OpenClaw cada treinta segundos. No es una llamada API pesada — solo un ping de estado de proceso que prácticamente no consume tokens. Si el ping falla tres veces consecutivas (para evitar falsas alarmas por pequeños fallos momentáneos), Hermes escala a una secuencia de diagnóstico:
- Leer los registros de errores de la última sesión de OpenClaw
- Clasificar el tipo de fallo — ¿es un problema de configuración, un error del proveedor de modelos, una corrupción de memoria o algo diferente?
- Aplicar la solución adecuada de su creciente biblioteca de patrones de reparación
- Reiniciar OpenClaw y verificar que el proceso esté saludable
- Enviarme una notificación por Telegram con un resumen de lo ocurrido y lo que se solucionó
La biblioteca de soluciones es donde el bucle de aprendizaje de Hermes brilla. La primera vez que Hermes se topó con un error de clave API tras una actualización de OpenClaw, tardó unos cuarenta segundos en diagnosticar y reparar. La tercera vez — porque Hermes ya había extraído y refinado el patrón — tardó once segundos. Ese número sigue mejorando a medida que Hermes encuentra y cataloga nuevos tipos de fallos.
Esto funciona en ambas direcciones, por cierto. OpenClaw monitoriza la salud de Hermes con el mismo enfoque. Si Hermes falla (raro, pero sucede), OpenClaw se encarga de la recuperación. El sistema no tiene un único punto de fallo, que es exactamente la propiedad que buscas en cualquier infraestructura de nivel producción.
Aquí tienes la configuración que utilicé para establecer la comprobación de salud en el lado de Hermes. La configuración reside en el planificador de tareas de Hermes:
name: openclaw_health_monitor
schedule: "*/30 * * * * *" # cada 30 segundos
model: chatgpt # modelo ligero para eficiencia de costes
task: |
Comprueba si el proceso de OpenClaw está en ejecución y responde.
Si no responde en 3+ comprobaciones consecutivas:
1. Leer /var/log/openclaw/latest.log
2. Identificar la causa raíz
3. Aplicar solución de la biblioteca repair-patterns
4. Reiniciar el servicio openclaw
5. Notificar por Telegram: resumen del fallo + solución aplicada
retry_on_failure: true
max_retries: 3
Consejo profesional: No configures el intervalo de comprobación de salud por debajo de 30 segundos. Probé con intervalos de 10 segundos al principio y el coste en tokens era notable — no catastrófico, pero innecesario. Treinta segundos te da una detección suficientemente rápida sin quemar presupuesto en pings redundantes.
Solo el flujo de respaldo ya justificó la configuración de Hermes. Pero el siguiente flujo de trabajo — el que uso para el trabajo real de proyectos — es donde ocurre la verdadera multiplicación de productividad.
Flujo de trabajo 2: El patrón Supervisor-Constructor que cambió mi forma de entregar proyectos
Este es el flujo de trabajo que utilizo con más frecuencia, y es el que produce los resultados más impactantes. El concepto está inspirado en las estructuras tradicionales de equipos de software: una persona planifica y revisa, otra persona construye.
En este patrón, OpenClaw asume el rol de supervisor. Toma un objetivo de alto nivel — "construir un dashboard Next.js para el sistema de monitoreo de escáneres" — y lo desglosa en un plan de implementación detallado. Arquitectura de componentes, estructura de archivos, flujo de datos, endpoints de API, librerías y versiones específicas a utilizar. OpenClaw ejecutándose en Opus 4.6 sobresale en este tipo de pensamiento arquitectónico. Considera casos límite, anticipa problemas de integración y produce planes realmente listos para producción.
Luego Hermes recibe el plan y lo construye.
La transferencia ocurre a través de un directorio de espacio de trabajo compartido — más detalles sobre esto en el flujo de trabajo 4. OpenClaw escribe el plan como un archivo markdown estructurado. Hermes lo recoge, analiza los requisitos y comienza a ejecutar. Como Hermes corre sobre un modelo más ligero, la ejecución cuesta solo una fracción de lo que costaría si OpenClaw hiciera la construcción por sí mismo.
Pero aquí está el detalle que la mayoría pasa por alto: después de que Hermes completa la construcción, OpenClaw revisa el resultado. Verifica el código contra el plan original, identifica brechas, sugiere mejoras y, o bien aprueba, o bien envía solicitudes de revisión específicas de vuelta a Hermes.
Este paso de revisión es fundamental. Sin él, estarías confiando en la salida de un modelo ligero sin verificación de calidad. Con él, obtienes la eficiencia de costos de un modelo de ejecución económico combinada con la garantía de calidad de un modelo de revisión premium. La calidad del resultado es consistentemente superior a la que cualquiera de los agentes produce por separado.
Un ejemplo real de la semana pasada. Necesitaba un dashboard para monitorear una flota de escáneres de red — indicadores de estado para cada escáner, registros de errores, métricas de tiempo en línea y un sistema de alertas sencillo. Aquí tienes la versión abreviada de cómo se desarrolló:
Plan de OpenClaw (generado en unos 90 segundos en Opus 4.6):
- App Next.js 15 con App Router
- Cuatro componentes principales: ScannerGrid, StatusCard, ErrorLog, AlertPanel
- Obtención de datos del lado del servidor con revalidación cada 30 segundos
- Tailwind CSS con tema oscuro alineado a mi sistema de diseño existente
- Conexión WebSocket para actualizaciones en tiempo real del estado de los escáneres
- Estructura de archivos, props de componentes y esquemas de datos específicos
Construcción de Hermes (completada en unos seis minutos en ChatGPT):
- Los cuatro componentes construidos y funcionales
- Layout y rutas configuradas
- Rutas de API para datos de escáner implementadas
- Estilos básicos aplicados
Revisión de OpenClaw (unos 45 segundos):
- Detectó la ausencia de un error boundary alrededor de la conexión WebSocket
- Sugirió añadir una estrategia de reconexión con backoff exponencial
- Observó que el componente StatusCard no gestionaba el estado "escáner fuera de línea por más de 24 horas"
- Aprobó la arquitectura general y la estructura de componentes
Revisión de Hermes (unos dos minutos):
- Aplicó las tres correcciones
- Añadió la lógica de reconexión
- Gestionó el estado de fuera de línea extendido
Tiempo total desde el objetivo hasta el dashboard funcionando: aproximadamente diez minutos. Costo total: unos $0.85 en tokens de API. Si hubiera hecho que OpenClaw hiciera todo — planificación, construcción y revisión en Opus 4.6 — el mismo trabajo habría costado alrededor de $3.40 y tomado unos quince minutos. Misma calidad, 75% menos costo.
Esa proporción se mantiene en la mayoría de mis proyectos. El patrón supervisor-constructor no es solo un truco de productividad: es una optimización estructural de costos que se acumula con el tiempo.
Si prefieres que alguien construya este tipo de configuración multiagente desde cero, acepto encargos de infraestructura de IA a través de mi perfil de Fiverr.
El siguiente flujo de trabajo aborda algo que los patrones de respaldo y supervisor no cubren: la supervisión continua de procesos de larga duración.
Flujo de trabajo 3: El sistema de monitorización que vigila mientras duermo
Algunas tareas no requieren construcción activa. Requieren vigilancia. Por ejemplo, mi flota de escáneres funciona 24/7 sobre múltiples objetivos. No puedo revisar personalmente el estado de cada escáner cada pocas horas. Y no lo necesito: ese es exactamente el tipo de trabajo repetitivo y basado en cadencia que un agente de IA maneja a la perfección.
El flujo de monitorización pone a Hermes en un rol de perro guardián. Cada dos horas (configurable, por supuesto), Hermes ejecuta una comprobación programada sobre objetivos de monitorización predefinidos. Extrae los estados de los escáneres, verifica condiciones de error, compara el rendimiento contra métricas base y me envía un resumen por Telegram.
La decisión clave de diseño: Hermes se encarga de la monitorización, no OpenClaw. Hay dos razones para esto.
Primero, el coste. Una comprobación de monitorización cada dos horas, 24/7, suma 84 comprobaciones por semana. Ejecutarlas en Opus 4.6 costaría notablemente más que hacerlo en ChatGPT o GLM-5. La tarea de monitorización no requiere razonamiento a nivel Opus: es comparación de patrones y umbrales. El modelo más ligero lo gestiona perfectamente.
Segundo, la disponibilidad. Si OpenClaw está ocupado con una tarea compleja de planificación o revisión, no quieres que tu monitorización quede en cola detrás de ella. Hermes funcionando de forma independiente significa que la monitorización nunca se retrasa por otros trabajos. Los dos agentes operan en grupos de recursos separados.
Así es como se ve un ciclo típico de monitorización:
[Hermes Monitor — 2026-04-14 02:00 UTC]
Comprobación de estado de la flota de escáneres:
├── Escáner Alpha: ✅ En línea (uptime: 99.7%, últimas 24h)
├── Escáner Beta: ✅ En línea (uptime: 98.2%, últimas 24h)
├── Escáner Gamma: ⚠️ Degradado (tiempo de respuesta 340ms → 890ms, investigando)
└── Escáner Delta: ✅ En línea (uptime: 100%, últimas 24h)
Acción tomada: Se abrió investigación por pico de latencia en Escáner Gamma.
Causa raíz: Retraso en la resolución DNS del proveedor ascendente.
Recomendación: No se requiere acción inmediata — se monitoriza para resolución.
Próxima comprobación: 2026-04-14 04:00 UTC
Ese informe llegó mientras dormía. Cuando me desperté a las 7 AM, el problema de Gamma ya se había resuelto solo — y Hermes había registrado la resolución en el sistema de memoria compartida, incluyendo la causa raíz y la línea de tiempo. Si vuelve a ocurrir, ambos agentes conocen el patrón y pueden responder más rápido.
La configuración del cron job para esto es sencilla:
# hermes-tasks/scanner-monitor.yml
name: scanner_fleet_monitor
schedule: "0 */2 * * *" # cada 2 horas
model: chatgpt
task: |
Verifica el estado de todos los escáneres activos.
Para cada escáner, comprueba:
- Que el proceso esté en ejecución
- Que el tiempo de respuesta esté dentro del umbral (< 500ms)
- Que no haya logs de error en las últimas 2 horas
- Porcentaje de uptime en las últimas 24h
Reporta cualquier anomalía con nivel de severidad.
Si es crítica: alerta inmediata por Telegram.
Si es advertencia: inclúyela en el próximo informe resumen.
Registra todos los hallazgos en el espacio de memoria compartida.
escalation_threshold: critical
notify_channel: telegram
El flujo de monitorización se complementa de forma natural con el flujo de respaldo. Si Hermes detecta que el propio OpenClaw es la fuente de un problema — por ejemplo, que OpenClaw haya iniciado una tarea que consume recursos en exceso — Hermes puede señalarlo antes de que el problema se propague. Así obtienes un sistema donde nada falla en silencio, que es el tipo de fallo más peligroso en cualquier sistema automatizado.
Pero los tres flujos de trabajo que he descrito hasta ahora comparten una limitación: los agentes aprenden de forma independiente. OpenClaw desarrolla su propio entendimiento de problemas y soluciones. Hermes desarrolla el suyo. Ninguno se beneficia de lo que el otro ha aprendido.
Eso es lo que resuelve el cuarto flujo de trabajo.
Flujo de trabajo 4: Memoria compartida — Donde ambos agentes se vuelven más inteligentes juntos
Este es el flujo de trabajo que eleva la combinación OpenClaw-Hermes de “útil” a “compuesta”. El concepto es engañosamente simple: ambos agentes leen y escriben en una base de conocimientos compartida. En la práctica, esto crea algo muy parecido a la memoria organizacional: conocimiento institucional que persiste sin importar qué agente esté activo.
Yo implemento esto a través de Obsidian. No porque Obsidian sea la única opción — cualquier sistema de archivos compartido funcionaría — sino porque la estructura enlazada de markdown de Obsidian hace que la base de conocimientos también sea navegable para humanos. Puedo abrir el vault, buscar en él, ver conexiones entre las entradas y entender lo que mis agentes han estado aprendiendo. Esa transparencia es importante cuando confías trabajo real a sistemas autónomos.
El espacio de trabajo de memoria compartida vive en una carpeta sincronizada a la que ambos agentes pueden acceder. La estructura se ve así:
shared-memory/
├── logs/
│ ├── openclaw/
│ │ └── 2026-04-14-session.md
│ └── hermes/
│ └── 2026-04-14-monitor.md
├── mistakes/
│ ├── api-key-rotation-failure.md
│ ├── websocket-reconnection-missing.md
│ └── scanner-dns-resolution-delay.md
├── patterns/
│ ├── repair-patterns.md
│ ├── build-review-patterns.md
│ └── monitoring-baselines.md
├── decisions/
│ └── architecture-decisions.md
└── context/
├── project-scanner-fleet.md
└── project-content-pipeline.md
Cada vez que un agente se encuentra con algo que vale la pena recordar —un error, un patrón de reparación exitoso, una decisión sobre cómo manejar un escenario específico— escribe una entrada en la carpeta correspondiente. La entrada incluye qué ocurrió, por qué ocurrió, qué hizo el agente al respecto y qué haría diferente la próxima vez.
Aquí tienes una entrada real de mi carpeta de errores, escrita por Hermes después de una falsa alarma de monitoreo:
# Falsa alarma: Timeout en Scanner Gamma — 2026-04-11
---
## Qué ocurrió
Hermes marcó Scanner Gamma como "crítico — sin respuesta" a las 14:22 UTC.
Envió alerta inmediata por Telegram. OpenClaw inició diagnóstico de emergencia.
## Qué sucedió realmente
Scanner Gamma estaba respondiendo con normalidad. La verificación de monitoreo excedió el tiempo de espera debido a un fallo momentáneo en la red del host de monitoreo, no del propio escáner.
## Impacto
Alerta innecesaria. Se desperdiciaron aproximadamente $0.12 en costos de tokens de diagnóstico. Se interrumpió la tarde de Mejba con una notificación de emergencia falsa.
## Solución aplicada
Se añadió lógica de reintentos: 3 fallos consecutivos antes de escalar a "crítico".
Un solo fallo ahora se registra como "investigando" sin generar alerta.
## Patrón extraído
Los problemas a nivel de red en el host de monitorización pueden simular fallos en el objetivo. Siempre vuelve a intentar antes de escalar. Verifica la salud del host de monitorización como parte de la secuencia de diagnóstico.
Esa entrada ahora está disponible para ambos agentes. Cuando OpenClaw ejecuta sus propias tareas de monitorización, tiene acceso a este patrón. Cuando Hermes se encuentra con una situación similar en el futuro, no repite el mismo error. El sistema aprendió una vez y ambos agentes se benefician.
A esto me refiero con auto-mejora recursiva. No es la versión de Hollywood donde la IA de repente se vuelve superinteligente. Es la versión aburrida y práctica: el sistema acumula conocimiento operativo con el tiempo, y ese conocimiento lo hace más fiable, más preciso y menos costoso de operar.
Hermes tiene aquí una ventaja nativa gracias a su bucle de aprendizaje integrado. El plugin Hermes Memory Keep-Alive para Obsidian sincroniza su memoria interna con el vault, así que los recuerdos clave, los datos de entidades y el historial de conversaciones fluyen automáticamente al espacio de trabajo compartido. OpenClaw requiere un poco más de configuración manual para escribir en la carpeta compartida — uso una habilidad personalizada que se activa después de cada sesión para volcar los aprendizajes relevantes — pero el resultado final es el mismo: ambos agentes contribuyen y extraen información de la misma base de conocimiento.
Después de tres meses ejecutando este sistema, mi vault de memoria compartida contiene más de 400 entradas. Los agentes consultan estas entradas de forma autónoma durante su trabajo. He visto a OpenClaw citar una entrada de error de Hermes mientras planificaba una build, ajustando su arquitectura para evitar un modo de fallo conocido. Ese es el tipo de aprendizaje cruzado entre agentes que hace que todo el sistema se sienta menos como dos herramientas separadas y más como un solo equipo con conocimiento institucional compartido.
La ecuación de costos de la que nadie habla con honestidad
Voy a ser directo respecto a los costos porque la mayoría de los artículos sobre configuraciones multiagente los ignoran o los presentan como si fueran insignificantes.
Ejecutar OpenClaw sobre Opus 4.6 no es barato. Una sesión persistente con tareas activas de planificación y revisión me cuesta aproximadamente entre $80 y $120 al mes en gastos de API, dependiendo de la carga de trabajo. Ese es el precio que pagas por razonamiento de primer nivel en tareas complejas.
Ejecutar Hermes con el plan de $20 de ChatGPT cubre la mayor parte de mi carga de trabajo de ejecución y monitoreo. Para tareas de procesamiento por lotes donde necesito costos aún más bajos, GLM-5 lo gestiona a aproximadamente $0.001-0.003 por cada 1K tokens, una cifra insignificante para monitoreo y tareas simples de ejecución.
Mi gasto mensual total en el sistema de dos agentes: aproximadamente $130-160.
Para ponerlo en contexto, mi configuración anterior —ejecutando todo a través de OpenClaw en Opus— me costaba aproximadamente entre $200 y $280 al mes, con menos capacidades totales y cero redundancia. El sistema combinado cuesta menos y hace más. El patrón supervisor-constructor por sí solo ahorra lo suficiente en costos de tokens de Opus como para cubrir todo el gasto operativo de Hermes.
Pero hay un costo que la mayoría no contempla: el tiempo de configuración. Conseguir que los dos agentes estén correctamente configurados, que el sistema de memoria compartida funcione, que los chequeos de salud estén calibrados y que la transferencia entre supervisor y constructor sea fiable me llevó alrededor de dos fines de semana completos. Eso es una inversión real de tiempo. Si solo usas un agente para tareas simples y funciona bien, la configuración multiagente puede ser una sobreingeniería del problema.
El punto de equilibrio, según mi experiencia, llega justo cuando te descubres diciendo “Necesito comprobar si mi agente sigue funcionando”. Si estás monitoreando a tu agente en vez de que tu agente monitoree tu trabajo, necesitas un segundo agente.
Lo que este sistema hace mal — Y lo que aún estoy resolviendo
Después de tres meses, el sistema no es perfecto. Ser honesto sobre las carencias importa más que fingir que no existen.
Deriva de contexto entre agentes. Incluso con memoria compartida, OpenClaw y Hermes a veces desarrollan comprensiones ligeramente diferentes del mismo proyecto. OpenClaw puede planificar una funcionalidad usando un patrón arquitectónico, mientras que Hermes ya ha evolucionado hacia un patrón distinto a través de su ciclo de aprendizaje. La memoria compartida ayuda, pero no elimina por completo la divergencia. Realizo una revisión manual de alineación aproximadamente una vez por semana, donde reviso el espacio de trabajo compartido y sincronizo explícitamente la comprensión de los agentes sobre los proyectos activos.
Conflictos de actualización. Tanto OpenClaw como Hermes publican actualizaciones de forma regular. Cuando ambos se actualizan en la misma semana —lo cual sucede más seguido de lo que quisiera— hay una probabilidad significativa de que una actualización rompa la compatibilidad con la otra. He comenzado a escalonar mis actualizaciones: OpenClaw los lunes, Hermes los jueves. Esto añade una carga de gestión, pero significa que nunca tengo ambos agentes fuera de servicio al mismo tiempo.
La paradoja de la depuración. Cuando algo falla en el sistema de dos agentes, a veces es más difícil diagnosticarlo que un fallo en un solo agente. ¿OpenClaw le dio a Hermes un mal plan? ¿Hermes ejecutó mal un buen plan? ¿La memoria compartida contenía un patrón defectuoso que desvió a ambos agentes? La superficie de depuración es mayor. Un buen registro de logs mitiga esto, pero no lo elimina.
Riesgo de dependencia de modelos. Mi configuración actual depende de Opus 4.6 para OpenClaw y ChatGPT para Hermes. Si alguno de los proveedores de modelos sufre una caída, la mitad de mi sistema queda fuera de servicio. Estoy experimentando con configuraciones de respaldo —OpenClaw en Sonnet 4.6 como una copia degradada pero funcional, Hermes en GLM-5 como su respaldo— pero aún no he probado completamente las implicaciones de calidad de esos respaldos bajo cargas de trabajo reales.
Estos son problemas solucionables, no fallos fundamentales. Y la ganancia de productividad del sistema en pareja supera ampliamente a cada uno de ellos. Pero debes tener expectativas realistas sobre lo que realmente significa "multiagente" en la práctica diaria: no es configurar y olvidar. Es configurar y mantener, con un coste de mantenimiento que disminuye con el tiempo a medida que crece la memoria compartida.
Cómo empezar: la configuración de 30 minutos que te da el 80% del valor
Si quieres probar esto sin comprometer un fin de semana completo, aquí tienes la versión mínima viable. Puedes expandirla más adelante, una vez que veas el valor.
Paso 1: Instala ambos agentes (10 minutos).
OpenClaw funciona en cualquier sistema con Node.js. El repositorio de GitHub (openclaw/openclaw) tiene una instalación con un solo comando. Hermes se instala de manera similar desde NousResearch/hermes-agent. Ambos son compatibles con Mac, Linux y Windows.
Paso 2: Configura el flujo de respaldo (10 minutos).
Configura Hermes para que monitorice la salud del proceso de OpenClaw cada 60 segundos (empieza de forma conservadora, optimiza después). Solo esto ya te da el flujo de trabajo más valioso de inmediato: recuperación automática ante caídas.
Paso 3: Crea la carpeta de memoria compartida (5 minutos).
Una estructura de directorios sencilla: logs, errores, patrones. Haz que ambos agentes apunten a ella. Más adelante puedes añadir Obsidian si quieres una interfaz navegable.
Paso 4: Ejecuta tu primera tarea supervisor-constructor (5 minutos).
Dale a OpenClaw una pequeña tarea de planificación. Haz que escriba el plan en la carpeta compartida. Indica a Hermes que ejecute el plan. Revisa el resultado. Ese es el flujo de trabajo.
No necesitas los cron jobs de monitorización el primer día. No necesitas esquemas elaborados de memoria compartida. No necesitas una optimización de costes perfecta. Empieza con respaldo y supervisor-constructor. Esos dos patrones te entregan la mayor parte del valor y te enseñarán cómo interactúan los agentes antes de añadir complejidad.
Hacia dónde se dirigen los sistemas multiagente
La combinación OpenClaw-Hermes que utilizo hoy es, sospecho, un adelanto de cómo la mayoría de los desarrolladores trabajarán con IA en los próximos doce meses. No se tratará de un agente monolítico que lo haga todo, sino de agentes especializados con roles definidos, contexto compartido y fortalezas complementarias.
Las señales ya son visibles. Databricks lanzó una arquitectura de agente supervisor para flujos de trabajo empresariales. CrewAI y LangGraph están construyendo capas de orquestación para la coordinación multiagente. La propia hoja de ruta de OpenClaw incluye protocolos de comunicación interagente más profundos. El bucle de aprendizaje de Hermes —la idea de que un agente debe mejorar de manera medible en tareas repetidas— también está apareciendo en otros frameworks.
La ventaja competitiva en este momento no es tener el mejor agente individual. Es tener el mejor equipo de agentes. Un sistema donde la planificación ocurre en un modelo que es bueno planificando, la ejecución en un modelo que es bueno ejecutando, y la monitorización sucede de forma continua sin intervención humana.
Hace unas semanas escribí sobre cómo los agentes OpenClaw pueden escalar un negocio y el cambio de tareas a trabajos. El sistema de dos agentes lleva esto un paso más allá: no se trata solo de asignar trabajos a los agentes, sino de darles colegas. Un agente con respaldo, un revisor y una base de conocimiento compartida es cualitativamente diferente a un agente que trabaja solo.
Configura el flujo de trabajo de respaldo esta noche. Observa cómo un agente corrige al otro por primera vez. ¿Esa recuperación de once segundos que describí al principio de este artículo? No es el techo de lo que este sistema puede hacer. Es el suelo.
Preguntas Frecuentes
¿Puedo ejecutar OpenClaw y Hermes en la misma máquina?
Sí. Ambos agentes son lo suficientemente ligeros como para ejecutarse en un solo Mac Mini M4 o una máquina Linux equivalente con 16GB de RAM. Yo ejecuto ambos en una sola máquina: OpenClaw como proceso principal y Hermes como servicio en segundo plano. La clave es asegurarse de que utilicen proveedores de modelos diferentes para que los límites de tasa de la API no entren en conflicto.
¿Cuánto cuesta al mes la configuración de dos agentes OpenClaw y Hermes?
Calcula entre $130 y $160 al mes en total — aproximadamente $80-120 para OpenClaw en Opus 4.6 y $20-40 para Hermes en ChatGPT o GLM-5. El costo exacto depende de la intensidad de la carga de trabajo. El patrón supervisor-constructor suele ahorrar entre un 40% y un 75% en comparación con ejecutar todo en un modelo premium únicamente.
¿Necesito Obsidian para el sistema de memoria compartida?
No. Cualquier carpeta compartida a la que ambos agentes puedan leer y escribir funciona. Obsidian añade una interfaz de notas enlazadas y navegables que hace que la base de conocimiento sea legible para humanos, pero un simple directorio de archivos markdown ofrece el mismo beneficio funcional para los agentes. Recomiendo empezar con una carpeta sencilla y añadir Obsidian más adelante si quieres auditar y explorar la memoria compartida manualmente.
¿Qué ocurre si ambos agentes se bloquean al mismo tiempo?
Es raro, pero posible — normalmente causado por un problema a nivel de sistema como un corte de energía o un fallo del sistema operativo, más que por un fallo a nivel de agente. Yo utilizo un watchdog simple con systemd (launchd en macOS) que reinicia ambos agentes si sus procesos mueren. Esta tercera capa de redundancia no tiene coste y resuelve el caso límite de forma eficaz.
¿Puedo usar modelos diferentes a Opus 4.6 y ChatGPT?
Por supuesto. OpenClaw es compatible con más de 50 proveedores de modelos, incluidos Gemini, GLM-5, Sonnet 4.6 y modelos locales a través de Ollama. Hermes funciona con cualquier API compatible con OpenAI. La combinación Opus + ChatGPT es mi recomendación para el mejor equilibrio entre calidad y coste, pero puedes ejecutar ambos en modelos más económicos si el presupuesto es la principal limitación — solo ten en cuenta que la calidad será menor en tareas complejas de planificación.
Trabajemos Juntos
¿Buscas construir sistemas de IA, automatizar flujos de trabajo o escalar tu infraestructura tecnológica? Me encantaría ayudarte.
- Fiverr (desarrollos e integraciones a medida): fiverr.com/s/EgxYmWD
- Portafolio: mejba.me
- Ramlit Limited (soluciones empresariales): ramlit.com
- ColorPark (diseño & branding): colorpark.io
- xCyberSecurity (servicios de seguridad): xcybersecurity.io