Hermes + Claude Code: Meu VPS build system baseado em Discord
Eram 23h51 de uma terça-feira quando digitei /build a Next.js task tracker with SQLite, deploy it to Vercel em um canal Discord e saí para fazer um café. No momento em que a chaleira foi desligada, meu agente Hermes havia ativado Claude Code como um sub-agent em meu Hostinger VPS, estruturado o projeto, enviado um commit inicial para um novo repositório GitHub e acionado uma implantação Vercel.
Então falhou.
Não catastroficamente. Apenas a maneira específica e previsível pela qual os aplicativos Next.js falham quando você os envia para um tempo de execução serverless que transporta suposições SQLite do desenvolvimento local. A construção ficou verde. A implantação foi concluída em 31 segundos. A primeira solicitação para /api/tasks retornou 500 com um erro de permissão de gravação do sistema de arquivos somente leitura Vercel entrega todos os Lambda. Eu não disse nada ao Claude Code sobre restrições de tempo de execução - apenas disse "implante". O agente fez exatamente o que eu pedi. A plataforma de implantação teve outras ideias.
O que aconteceu a seguir é a parte sobre a qual quero contar. Hermes recebeu o log de falha por meio do webhook Discord, enviou-o de volta ao Claude Code como uma tarefa de acompanhamento e Claude Code passou os próximos quatro minutos refatorando a camada de dados para usar Vercel KV em vez de SQLite. Novo commit. Nova implantação. Verde. Ponto final de trabalho. Voltei da cozinha para uma mensagem Discord que dizia, em essência, "encontrei um problema no sistema de arquivos serverless, trocado para KV, reimplantado. Demonstração aqui." Todo o ciclo – prompt original para implantação de produção funcional – levou oito minutos e quarenta e três segundos. Não escrevi nenhuma linha de código.
Esse é o sistema que quero quebrar. Não é a versão de marketing. A implementação real, os comandos reais e as partes que me incomodam - incluindo a compensação de segurança que a maioria dos tutoriais ignora e a pergunta que tenho me feito todas as semanas: quando essa camada de orquestração realmente vale a pena e quando estou apenas adicionando partes móveis?
Por que Hermes fica entre mim e Claude Code
Deixe-me abordar primeiro a pergunta cética óbvia, porque eu mesmo me perguntei por cerca de três semanas antes de mudar: se o Claude Code já pode planejar, escrever, executar e implantar código, por que estou colocando outro agente em cima dele?
A resposta curta é que Claude Code é uma sessão de terminal brilhante e Hermes é uma camada de operações brilhante. Eles resolvem problemas diferentes.
O ponto forte do Claude Code é a profundidade em uma única tarefa. Dê a ele uma base de código, um objetivo e um terminal, e ele planejará, escreverá, testará e iterará com uma qualidade de raciocínio que é realmente difícil de superar no momento. Mas o Claude Code, por si só, não faz naturalmente a bagunça operacional. Ele não observa suas próprias implantações e não reage a falhas. Não aceita comandos de Discord. Ele não é executado em um VPS enquanto você está dormindo, não faz malabarismos com três projetos em paralelo ou armazena tokens API criptografados no disco para que você pare de colá-los em caixas de bate-papo. Você pode construir tudo isso em torno do Claude Code com scripts de shell e tarefas cron. Eu tentei. O resultado é uma pilha frágil de cola que você mesmo precisa manter.
Hermes Agent é a cola, mas uma versão dela que se aprimora. Construído pela Nous Research e lançado em 25 de fevereiro de 2026, ele cruzou 95.600 estrelas GitHub em sete semanas e está ao norte de 103.000 no momento em que este livro foi escrito – o tipo de trajetória que você só vê quando algo resolve um problema que as pessoas realmente têm. Hermes vem com integrações nativas para WhatsApp, Telegram, Discord, Slack e agora QQBot, armazenamento de token criptografado via hermes config set, um sistema de plugins, um modo orquestrador que supervisiona sub-agents e um ciclo de aprendizagem que transforma tarefas únicas em habilidades reutilizáveis. É licenciado pelo MIT e funciona com um VPS de US$ 5.
Quando Hermes trata Claude Code como sub-agent, você obtém o melhor de ambos. Claude Code faz a engenharia propriamente dita. Hermes cuida da orquestração: onde o trabalho é executado, quem tem permissão para acioná-lo, como as falhas são repetidas, onde residem os segredos e em qual plataforma de mensagens você está quando deseja verificar o status. Eu executo meu orquestrador no mesmo padrão VPS que descrevi em [meu sistema de dois agentes OpenClaw e Hermes] (/openclaw-hermes-multi-agent-workflow), e a arquitetura resistiu sob carga real.
Há uma razão mais profunda para esse emparelhamento funcionar: é uma questão de disciplina de custos. Claude Code em uma tarefa autônoma longa queima tokens. Hermes tem o prazer de rodar em modelos mais baratos para a camada de orquestração - a maior parte do meu tráfego Hermes flui através do OpenRouter em modelos mais leves, enquanto o Claude Sonnet 4.6 (atualmente US$ 3 por milhão de tokens de entrada, US$ 15 por milhão de tokens de saída no OpenRouter) lida apenas com o trabalho de codificação real. A divisão me economiza dinheiro real em cada projeto, e a economia aumenta à medida que executo mais tarefas paralelas.
Mas nada disso importa se você não conseguir fazer a coisa funcionar. Então, vamos conectar isso.
Fundação VPS: Por que parei de executar agentes localmente
Executei o Claude Code localmente no meu Mac durante os primeiros seis meses de uso. O padrão era bom para trabalho solo, mas quebrou no momento em que eu queria três coisas: tarefas de longa execução que sobrevivessem ao fechamento do laptop, um endereço estável para os webhooks Discord serem atingidos e um local onde várias sessões de agentes paralelos pudessem ser executadas sem competir pela minha CPU durante chamadas de vídeo. Um VPS resolve todos os três de uma vez.
Eu uso a Hostinger. Seu plano KVM 2 atualmente custa US$ 6,99 por mês introdutório (renova cerca de US$ 11,99/month, que é a parte sobre a qual as páginas de marketing não falam) e oferece 2 vCPUs, 8 GB de RAM, armazenamento SSD NVMe e um IP dedicado. Isso é suficiente para orquestrar algumas sessões Claude Code em paralelo. Seu KVM 1 por US$ 4,99/month com 4 GB de RAM também funciona se você estiver executando apenas um único agente por vez – o próprio Hermes é surpreendentemente leve em recursos porque a maior parte do trabalho pesado acontece dentro dos provedores de modelo, não na caixa.
Se você é Hetzner ou DigitalOcean, eles também funcionam bem. Os únicos requisitos importantes são acesso SSH, Ubuntu 22.04 ou mais recente, Node.js 18+ e acesso de rede de saída para seu provedor modelo. Estou especificando o Hostinger porque o console SSH via navegador que ele acompanha significa que você pode instalar o Hermes de qualquer máquina, incluindo o iPad no qual estou escrevendo este parágrafo.
Depois de obter o VPS, o comando de instalação é genuinamente uma linha. SSH e execute:
curl -fsSL https://hermes-agent.dev/install.sh | bash
Isso inicializa o Node, instala o Hermes globalmente, cria um diretório de configuração ~/.hermes e leva você a um assistente de primeira execução que solicita as chaves do seu provedor de modelo. Eu sempre escolho o OpenRouter neste estágio, em vez de ir direto para o Anthropic. O motivo é simples: o OpenRouter me permite trocar modelos por tarefa sem alterar a configuração, o que é importante quando estou roteando o trabalho de planejamento para um modelo barato e a execução para Claude Sonnet 4.6 ou Opus 4.7.
Defina a chave OpenRouter com:
hermes config set OPENROUTER_API_KEY <your-key-here>
Esse comando armazena a chave criptografada em ~/.hermes/secrets.enc, não em texto simples, o que é mais importante do que as pessoas imaginam. Eu auditei muitos tutoriais onde alguém diz para você export ANTHROPIC_API_KEY=sk-... em seu .bashrc e considera isso bom. Essa chave agora reside no histórico do seu shell, na rolagem do tmux e em qualquer backup do seu diretório inicial. O armazenamento criptografado do Hermes o mantém fora dos três lugares.
Agora a parte que demorei mais para acertar: instalar o Claude Code como um sub-agent no mesmo VPS.
Claude Code como subagente Hermes
Claude Code é um aplicativo Node.js, distribuído via npm em @anthropic-ai/claude-code. A instalação padrão no VPS é simples:
sudo apt update && sudo apt install -y nodejs npm
npm install -g @anthropic-ai/claude-code
claude-code --version
A verificação da versão é importante. Se você estiver vendo algo abaixo de 1.4.x em maio de 2026, você está perdendo as melhorias do sub-agent que chegaram no início deste ano, e o restante deste fluxo de trabalho não se comportará da maneira que estou descrevendo.
A parte interessante é autenticar o Claude Code sem uma área de trabalho interativa. Na primeira vez que você executar claude-code em um VPS novo, ele imprimirá uma URL OAuth e aguardará que você conclua o fluxo em um navegador. Em um VPS sem cabeça, isso é um pouco irritante, mas não bloqueador – o URL funciona em qualquer dispositivo. Abra-o em seu laptop, conclua o handshake OAuth e Claude Code armazena o token em ~/.config/claude-code/credentials.json no VPS. Desse momento em diante, seu VPS possui um Claude Code logado que sobrevive às reinicializações.
Agora você conecta Claude Code a Hermes como um sub-agent registrado. A configuração Hermes para isso reside em ~/.hermes/agents.toml:
[agents.claude_code]
type = "subagent"
command = "claude-code"
args = ["--print", "--no-interactive"]
working_dir = "/home/mejba/projects"
allowed_tools = ["Read", "Write", "Edit", "Bash", "Glob", "Grep", "WebSearch"]
max_concurrent = 3
timeout_seconds = 1800
A max_concurrent = 3 é a linha para a qual quero chamar a sua atenção. Ele controla quantas sessões Claude Code paralelas Hermes podem gerar. Comecei com 1 e fui aumentando. Aos 3 anos, minha caixa KVM 2 funciona quente, mas estável. Aos 5, vi o Node OOM sob carga quando todas as três sessões atingiram npm install ao mesmo tempo. Ajuste isso para o seu VPS, não para o que quer que o exemplo da documentação mostre.
O valor timeout_seconds = 1800 significa que Hermes eliminará qualquer tarefa Claude Code que seja executada por mais de trinta minutos. Isso parece agressivo até que você observe o Claude Code se encaixar em um loop infinito de planejar-executar-replanejar em um prompt vago. É melhor falhar rapidamente e revelar o problema do que deixar um agente preso queimar tokens durante a noite.
Integração GitHub sem colar tokens no bate-papo
Esta é a seção onde a maioria dos tutoriais me perde. Eles dizem para você colar seu token de acesso pessoal GitHub diretamente na janela de bate-papo do agente para que ele possa clonar repositórios e enviar commits. Essa é uma receita para o vazamento acidental de tokens – em logs de bate-papo, no histórico do provedor de modelo, em capturas de tela tiradas durante a depuração.
Hermes lida com isso de maneira diferente. Você gera um token de acesso pessoal refinado a partir das configurações do desenvolvedor do GitHub — limite-o aos repositórios específicos que você deseja que o agente toque e conceda apenas Contents: read/write, Pull requests: write e Metadata: read. Em seguida, armazene-o através do mesmo comando de configuração criptografado:
hermes config set GITHUB_TOKEN <your-fine-grained-token>
Dentro do diretório de trabalho Claude Code, você diz ao git para usar o token por meio da injeção de ambiente do Hermes em vez de incorporá-lo em uma URL remota. Minha configuração do git no VPS é assim:
git config --global credential.helper '!f() { echo "username=mejba"; echo "password=$GITHUB_TOKEN"; }; f'
Essa pequena função shell extrai o token do ambiente que Hermes injeta em tempo de execução, para que seus URLs remotos permaneçam limpos (https://github.com/user/repo.git, sem credenciais incorporadas), seu token nunca aparece na saída git config --list e a rotação do token fica a uma linha de distância de hermes config set.
A peça simbólica refinada é importante. Já vi desenvolvedores concederem à sua automação um token de acesso pessoal clássico com escopo repo completo, que dá ao agente acesso de gravação a todos os repositórios privados de sua conta, incluindo trabalho do cliente e projetos paralelos. Não faça isso. Gere um token refinado separado por projeto, com escopo apenas para o repositório desse projeto. Se o agente se tornar desonesto ou o VPS for comprometido, seu raio de explosão será um repositório, não toda a sua presença GitHub.
O bot Discord que impulsiona tudo
A camada Discord é o que faz esse fluxo de trabalho parecer ficção científica em vez de cron jobs. Posso estar em uma reunião, no trem, no sofá — em qualquer lugar onde o Discord esteja aberto — e enviar o código digitando em linguagem natural para um bot.
A configuração leva cerca de dez minutos na primeira vez. Percorra exatamente isso:
- Abra o Portal do desenvolvedor Discord, clique em "Novo aplicativo" e nomeie-o como desejar. 2. Na navegação esquerda, clique em “Bot”. Nessa página, role para baixo até Privileged Gateway Intents e ative Message Content Intent. Este é o que a maioria dos tutoriais esquece. Sem ele, seu bot pode ler que existe uma mensagem, mas não pode ler o que há nela. Você passará uma hora depurando "por que meu bot me ignora" antes de encontrar esta caixa de seleção. 3. Enquanto estiver na página do Bot, clique em “Redefinir Token” e copie o token imediatamente – Discord o mostra apenas uma vez. 4. Vá para "OAuth2" → "Gerador de URL". Em Escopos, verifique
boteapplications.commands. Em Permissões de bot, verifiqueSend Messages,Read Message History,Use Slash CommandseAttach Files. Discord gera um URL de convite na parte inferior da página. 5.
Abra esse URL, escolha o servidor em que deseja o bot e autorize-o. Ele aparecerá off-line porque ainda não iniciamos o processo.
De volta ao VPS, armazene o token do bot em Hermes:
hermes config set DISCORD_BOT_TOKEN <token-you-just-copied>
Em seguida, ative o transporte Discord em ~/.hermes/transports.toml:
[transports.discord]
enabled = true
allowed_channel_ids = ["1198347...your-channel-id"]
allowed_user_ids = ["29384...your-discord-user-id"]
command_prefix = "/"
O allowed_channel_ids e o allowed_user_ids são a camada de segurança que ninguém parece destacar na postagem do blog. Sem essas listas de permissões, qualquer pessoa que possa DM seu bot pode dirigir Claude Code em seu VPS. Com eles, o bot só obedece nos canais que você autorizou explicitamente. Obtenha seu ID de usuário Discord ativando o modo de desenvolvedor nas configurações de Discord e clique com o botão direito em seu nome de usuário → Copiar ID de usuário.
Reinicie Hermes (hermes restart) e o bot ficará online. Digite /status em seu canal autorizado. Se você vir uma resposta, o ciclo será fechado. Deste ponto em diante, cada comando digitado em Discord vai Discord → Hermes → Claude Code → de volta para Discord. Você está conduzindo compilações de produção a partir de um aplicativo de chat.
Implantação automática de Vercel: a última milha
Vercel é o destino de implantação padrão para qualquer coisa Next.js ou front-end estático, e a integração é gloriosamente enfadonha depois de configurada. Conecte sua conta GitHub a Vercel, conceda a ela acesso ao repositório para o qual Claude Code será enviado e configure Vercel para implantação automática no envio para main. Feito.
O plano Hobby é aquele em que realizo a maioria dos experimentos, e vale a pena conhecer os limites porque eles afetam você de maneiras específicas. Em maio de 2026, o Hobby oferece 100 GB de largura de banda por mês, 1 milhão de solicitações de borda e 100.000 invocações de função serverless. O tempo limite da função é limitado a 60 segundos e a largura de banda não tem opção de excesso – atinge 100 GB e suas implantações param até o próximo ciclo de faturamento. Para experimentação e demonstrações, tudo bem. Para qualquer coisa em que o tempo de atividade realmente seja importante, atualize para o Pro antes de bater na parede, não depois.
A peça Vercel adiciona mais uma volta ao loop: eu digito /build em Discord → Hermes roteia para Claude Code → Claude Code confirma e envia para GitHub → GitHub webhook é acionado Vercel → Vercel cria e implementa → Hermes pesquisa o URL de implementação Vercel e reporta de volta para Discord com o status. De ponta a ponta, uma implantação limpa ocorre em cerca de trinta segundos. A primeira vez que você assiste ao encerramento de um projeto que você desenvolveu a partir de uma única mensagem de bate-papo, é difícil não rir.
O erro SQLite: um tutorial sobre por que a arquitetura sem servidor funciona
Agora vamos à falha que descrevi na abertura, porque são os cinco minutos mais úteis de todo este post.
Quando Claude Code criou meu rastreador de tarefas Next.js, ele fez algo perfeitamente razoável: escolheu SQLite para armazenamento. SQLite é a resposta certa para quase todos os pequenos projetos Node.js. É zero-config, é enviado como um único arquivo e remove toda a etapa de "criar um banco de dados". Se eu estivesse implantando esse aplicativo em um Hostinger VPS ou em um contêiner de longa execução, teria funcionado perfeitamente.
Vercel não é um contêiner de longa execução. Vercel é serverless. Cada rota API é executada dentro de uma função AWS Lambda, e o Lambda tem regras: o sistema de arquivos é somente leitura, exceto /tmp, que é efêmero e não é compartilhado entre invocações. SQLite precisa gravar em seu arquivo de banco de dados. O arquivo de banco de dados em meu projeto estava em ./data/tasks.db. Quando o Lambda tentou abrir esse arquivo para gravação, o tempo de execução retornou EROFS: read-only file system, minha rota API retornou 500 e a implantação "foi bem-sucedida" embora fosse completamente não funcional.
Este é o modo de falha específico que você deve internalizar antes de permitir que um agente autônomo envie código para plataformas serverless: o agente não conhece a topologia de tempo de execução do seu destino, a menos que você o informe. Claude Code conhecia Next.js. Ele conhecia SQLite. Por padrão, ele não sabia que esta implantação específica do Vercel proíbe gravações do sistema de arquivos fora do /tmp.
A correção produzida pelo loop de nova tentativa de Hermes estava correta: troque SQLite por um armazenamento de valor-chave gerenciado que seja compatível com inicializações a frio de serverless. Vercel KV (ou Upstash Redis, que é o que o sustenta) oferece armazenamento persistente que funciona em invocações de função, com um nível gratuito que lida confortavelmente com o tráfego de demonstração. Claude Code refatorou a camada de dados em cerca de quatro minutos, a reimplantação ficou verde e o aplicativo funcionou.
Mas aqui está a lição mais profunda, e é a que agora incorporo em cada prompt Hermes que escrevo para implantações de produção: informe ao agente as restrições de tempo de execução antecipadamente. Meu modelo de prompt padrão atual inclui um parágrafo específico para projetos Vercel:
Implantação de destino: Vercel serverless. Restrições: nenhum sistema de arquivos grava fora de /tmp, tempo limite da função de 60 segundos, nenhum trabalho em segundo plano de longa execução, prefira Vercel KV ou serviços gerenciados externos para estado. Use o tempo de execução de borda quando for sensível à latência.
Esse único bloco de contexto, anexado a qualquer tarefa direcionada a Vercel, eliminou totalmente a categoria de falha SQLite-on-serverless. O agente não é vidente. Diga o que o ambiente de produção exige.
A conversa sobre segurança que a maioria dos tutoriais ignora
Serei direto aqui porque a versão alegre “veja como é fácil” deste artigo seria irresponsável. Quando você concede acesso total ao terminal Hermes em um VPS - e é exatamente isso que você está fazendo quando permite que ele gere Claude Code com Bash em sua lista de ferramentas permitidas - você está criando um agente automatizado que pode executar comandos shell arbitrários em uma máquina que contém seu token GitHub, suas chaves de provedor de modelo e acesso de gravação à sua produção implanta.
Três coisas devem fazer você parar e pensar antes de apertar esse botão.
Primeiro, a injeção imediata é real e não teórica. Se o seu bot Discord estiver configurado para ler mensagens e seu agente tiver acesso ao terminal, qualquer pessoa que puder convencer seu agente a executar um comando malicioso por meio de entrada criada terá acesso equivalente à raiz ao seu VPS. A lista de permissões allowed_user_ids em sua configuração Hermes Discord é sua defesa mais importante aqui. Se um estranho puder DM seu bot, você já perdeu. Bloqueie com força o canal e as listas de permissões de usuários.
Em segundo lugar, um VPS comprometido é tudo comprometido. Trate o VPS da mesma forma que trataria qualquer servidor de produção. Desative a senha SSH (somente chave). Habilite um firewall — ufw enable && ufw allow 22 && ufw default deny incoming é o mínimo absoluto. Execute atualizações autônomas para patches de segurança. Mantenha o backup do seu ~/.hermes/secrets.enc criptografado e alterne as chaves trimestralmente. Nada disso é paranóico. É o custo básico de execução de um agente automatizado que pode interferir nas coisas.
Terceiro, avalie deliberadamente as ferramentas do agente. A matriz allowed_tools em minha configuração Hermes é ["Read", "Write", "Edit", "Bash", "Glob", "Grep", "WebSearch"]. Observe o que não está lá: qualquer coisa que possa vazar dados para fora dos canais aprovados. Não concedo ao sub-agent acesso a recursos HTTP POST arbitrários, clientes de email ou CLIs de provedor de nuvem que não sejam relevantes para o projeto. Quanto mais estreita for a superfície da ferramenta, menor será o raio de explosão se algo der errado.
Especificamente para o trabalho do cliente, executo um VPS separado por projeto de alta confiança. O custo é de doze dólares por mês para duas caixas em vez de uma, e o isolamento significa que um único projeto comprometido não pode contaminar os outros. Essa é uma apólice de seguro barata.
O resumo honesto é este: esse fluxo de trabalho fornece a um agente AI um poder operacional significativo. Os ganhos de produtividade são reais, mas estão associados a riscos que devem ser geridos ativamente. Se você não estiver disposto a fazer o trabalho de segurança, execute Claude Code localmente e aceite as limitações.
Quando a orquestração Hermes realmente vale a pena?
Quero responder diretamente porque é a pergunta que recebo com mais frequência e a resposta não é “sempre”.
A orquestração Hermes vale a pena quando você tem dois dos seguintes:
- Você deseja conduzir o trabalho de codificação a partir de seu telefone ou de aplicativos de mensagens enquanto estiver longe de sua máquina de desenvolvimento.
- Você está executando várias sessões de agente em paralelo (três projetos, quatro projetos) e precisa de um supervisor que distribua o trabalho e revele falhas em um só lugar.
- Você está realizando tarefas de agente agendadas ou recorrentes (geração de conteúdo noturno, quebras de mercado por hora, monitoramento de implantação) onde uma execução de Hermes gerenciada por cron é mais confiável do que reabrir Claude Code localmente.
- Você precisa de gerenciamento de segredos criptografados porque está alternando tokens de cliente, trabalhando em várias organizações GitHub ou paranóico com a higiene de credenciais.
- Você está criando uma automação que precisa reagir a eventos externos (webhooks, falhas de implantação, agendar gatilhos) sem precisar usar o teclado.
A orquestração Hermes é um exagero quando:
- Você está trabalhando em um único projeto, em sua mesa, com horários de trabalho razoáveis. Basta abrir Claude Code em um terminal. A camada de orquestração adiciona complexidade operacional da qual você não se beneficiará.
- Você não tem nenhuma das necessidades de tarefas paralelas ou controle remoto acima. O custo da infraestrutura (VPS, tempo gasto aprendendo a configuração do Hermes, manutenção de segurança) supera os ganhos de conveniência.
- Você está no início de sua jornada Claude Code. Aprenda bem o Claude Code primeiro e, em seguida, coloque o Hermes por cima, depois de identificar pontos de atrito específicos que ele resolveria. Não comece com a camada de orquestração – você não saberá o que pedir dela.
Para mim, pessoalmente, o momento em que Hermes ganhou seu lugar foi quando comecei a executar Claude Code em três projetos de cliente em paralelo e precisava de algo para lembrar qual sessão era qual, rotear as mensagens Discord corretas para o canal de projeto correto e manter os logs de implantação separados. Antes disso, eu estava apenas adicionando peças móveis.
Os números rápidos, honestamente
No tutorial de David Andre, aprendi esse fluxo de trabalho com ganhos de velocidade de desenvolvimento de 4x a 8x. Quero ter cuidado com esse número porque a forma como você o mede é importante.
Para projetos greenfield onde o trabalho é “criar um aplicativo CRUD e enviá-lo para um nível gratuito” – sim, a aceleração é real. O que costumava levar uma noite de configuração, estruturação e depuração de implantação agora leva menos de quinze minutos do prompt ao URL funcional. Isso é algo como uma compressão de 10x nessa categoria específica de trabalho.
Para trabalhos de projeto em que o gargalo são as decisões de design, o julgamento do produto ou o entendimento do domínio – a aceleração é muito menor, talvez de 1,5x a 2x. O agente não é mais rápido do que eu para decidir o que construir. É mais rápido nas partes de digitar e colar. Quando a restrição muda para o pensamento, a camada de orquestração não ajuda muito.
Para manutenção e refatoração em bases de código existentes – os ganhos estão em algum ponto intermediário. Talvez 3x. Mais rápido que o manual, mais lento que o greenfield porque o agente precisa carregar e raciocinar sobre mais contexto existente e porque reviso com mais cuidado o código de produção.
O composto, em toda a combinação de trabalho que realmente faço, teve um aumento de aproximadamente 2,5x no rendimento desde que mudei para esta pilha. Real, mas não o título 8x.
Para onde vou levar isso a seguir
O padrão que estou experimentando agora é baseado em voz em vez de texto. Hermes oferece suporte ao transporte de notas de voz do Telegram e comecei a gravar memorandos de voz rápidos descrevendo o que desejo construir enquanto estou caminhando ou dirigindo. O Whisper transcreve, o Hermes encaminha a tarefa transcrita para o Claude Code no VPS e, quando me sento em frente a um teclado real, o trabalho de andaime está concluído. Parece menos comandar uma ferramenta e mais conversar com um engenheiro júnior que nunca dorme.
Vou escrever isso assim que tiver eliminado as arestas. Por enquanto, este é o sistema. Hermes em um VPS de US$ 7. Claude Code como sub-agent fazendo a codificação real. Discord como cabine. GitHub e Vercel como trilhos. Tokens criptografados, usuários permitidos, acesso a ferramentas com escopo definido. Um loop de repetição que aprende com seus erros.
Se você vai tentar isso, comece aos poucos. Não conecte toda a pilha no primeiro dia. Aumente o VPS, instale o Hermes, faça com que um único comando Discord /status funcione. Em seguida, adicione Claude Code como sub-agent e execute uma tarefa trivial - "criar um aplicativo Hello-World Express e confirmá-lo". Em seguida, adicione a implantação automática Vercel. Cada camada tem seus próprios modos de falha e você deseja aprendê-los isoladamente antes que se agravem.
Há uma questão que vale a pena responder ao decidir se deve construir isso: em doze meses, quanto do trabalho de engenharia atualmente em seu editor estará em uma janela de bate-papo? Minha aposta honesta é: mais do que você pensa. Torne-se fluente neste padrão agora, enquanto o custo de estar errado é apenas uma noite de experimentação. Torne-se fluente nisso mais tarde e você pagará as mensalidades dentro dos prazos dos clientes.
Perguntas frequentes
O que Hermes Agent faz que Claude Code não consegue fazer sozinho?
Hermes lida com a camada de orquestração em torno de Claude Code: integrações de plataforma de mensagens (Discord, Telegram, WhatsApp, Slack), armazenamento de token criptografado, supervisão paralela de sub-agent, execução de tarefas agendadas e notificações de plataforma cruzada. Claude Code continua sendo o cérebro da engenharia; Hermes é a camada de operações. Para obter o detalhamento completo da arquitetura, consulte a seção acima sobre por que Hermes fica entre você e Claude Code.
Quanto custa para executar Hermes mais Claude Code em um VPS?
Uma configuração viável custa cerca de US$ 7 a US$ 12 por mês para o VPS (preço introdutório do Hostinger KVM 2), mais o uso do seu modelo no OpenRouter ou faturamento direto da Anthropic. O Claude Sonnet 4.6 custa atualmente US$ 3 por milhão de tokens de entrada e US$ 15 por milhão de tokens de saída via OpenRouter, portanto, os custos por tarefa variam de acordo com a complexidade. Na maioria dos dias, gasto US$ 2 a US$ 5 em taxas de modelo em toda a pilha Hermes.
É seguro conceder acesso ao terminal do agente AI em meu VPS?
É administrável e não isento de riscos. Bloqueie o canal Discord e as listas de permissões de usuários, use tokens GitHub refinados com escopo por repositório, execute um firewall, desative o SSH de senha e alterne as chaves trimestralmente. A seção de compensações de segurança acima cobre os controles específicos que executo. Trate o VPS como uma infraestrutura de produção, não como um sandbox.
Por que a implantação do SQLite falhou no Vercel?
Vercel executa todas as rotas API no AWS Lambda, onde o sistema de arquivos é somente leitura fora de /tmp. SQLite precisa gravar em um arquivo de banco de dados, portanto, o tempo de execução retorna EROFS: read-only file system em cada gravação. A solução é usar um armazenamento gerenciado como Vercel KV ou Upstash Redis. Sempre passe restrições de tempo de execução para o agente no prompt inicial — consulte a seção SQLite para obter o modelo de prompt exato que uso agora.
Quando devo pular Hermes e apenas usar Claude Code diretamente?
Se você estiver trabalhando em um único projeto em sua mesa durante o horário de trabalho, pule Hermes — basta abrir Claude Code em um terminal. A camada de orquestração compensa quando você precisa de agentes paralelos, controle remoto orientado por chat, tarefas agendadas ou gerenciamento criptografado de vários tokens. Para a maioria dos desenvolvedores solo no primeiro mês com Claude Code, o terminal local é a resposta certa.
Vamos trabalhar juntos
Procurando construir sistemas AI, automatizar fluxos de trabalho ou dimensionar sua infraestrutura tecnológica? Eu adoraria ajudar.
- Fiverr (compilações e integrações personalizadas): fiverr.com/s/EgxYmWD
- Portfólio: mejba.me
- Ramlit Limited (soluções empresariais): ramlit.com
- ColorPark (design e marca): colorpark.io
- xCyberSecurity (serviços de segurança): xcybersecurity.io