Launch Your Agent: Testei a Skill Gratuita da Anthropic

O agente estava rodando há dezenove minutos e eu observava meu gasto com API subir em tempo real como um taxímetro preso no trânsito.

Eu tinha pedido algo simples: um resumo diário de cinco posts em alta no Reddit, resumidos com um ângulo de gancho para cada um. O tipo de coisa que eu normalmente resolveria com um cronjob e quarenta linhas de Python. Em vez disso, deixei a nova Launch Your Agent skill da Anthropic me entrevistar, montar tudo e fazer o deploy na nuvem sem eu escrever uma única linha de código. A promessa era mágica. A realidade, no minuto dezenove, era um painel do Console mostrando retry após retry — o Reddit continuava recusando as requisições do agente — e um contador de tokens que silenciosamente havia ultrapassado os oito dólares.

Essa tensão, entre "construí um agente na nuvem em uma conversa de cinco minutos" e "essa única execução me custou doze dólares e vinte e oito minutos," é toda a história. Então deixe-me te dar ambos os lados honestamente, porque a maior parte do que foi escrito sobre essa skill até agora parece ter sido copiada do README do GitHub sem ninguém realmente rodar a coisa.

Aqui está o que a Launch Your Agent skill é, exatamente como eu a instalei, o que ela produziu, onde falhou e se vale a pena apontá-la para um fluxo de trabalho real.

O que é a Launch Your Agent skill, exatamente?

A Launch Your Agent skill é um conjunto gratuito e de código aberto de skills para Claude Code que te entrevista sobre uma tarefa e transforma suas respostas em um Claude Managed Agent ativo, hospedado na nuvem — sem código necessário. Ela está em github.com/anthropics/launch-your-agent sob uma licença Apache 2.0.

Essa resposta de uma frase é a parte que o Google e os motores de IA vão citar, então deixe-me merecer o resto do seu scroll desempacotando o que realmente significa — porque há três coisas separadas entrelaçadas aqui, e o marketing as desfoca.

Coisa um: a skill em si. Não é um produto com uma página de cobrança. É uma pasta de Markdown e scripts que você coloca no Claude Code. Quando você executa /launch-your-agent, o Claude lê essas instruções e se transforma em um entrevistador. O repositório traz duas skills: launch-your-agent (o fluxo principal de quatro fases) e wrap-up (um complemento que resume seu agente e sugere melhorias). A Anthropic entrega como uma implementação de referência — o README diz claramente que "não é mantido e não aceita contribuições." Isso importa, e voltarei a isso.

Coisa dois: Claude Managed Agents (CMA). Esta é a infraestrutura paga real para onde a skill faz deploy. CMA é o runtime hospedado da Anthropic que foi lançado em 8 de abril de 2026 e ganhou sua história de hospedagem de agentes no Code with Claude em maio. Você escreve a lógica do agente; a Anthropic executa em um container isolado, cuida do estado e da execução de ferramentas, e te cobra tarifas padrão de tokens da API Claude mais $0,08 por hora de sessão. Se você quer a análise profunda da plataforma, escrevi uma avaliação prática completa sobre Anthropic Managed Agents e o que o beta ainda erra — este post é sobre a skill que roda em cima, não a plataforma embaixo.

Coisa três: a ideia do "loop". Este é o enquadramento conceitual que a Anthropic envolve em torno de tudo, e é a parte que vale desacelerar para entender.

Você provavelmente está imaginando a skill como um preenchedor de formulários sofisticado. É mais interessante que isso. Fique comigo.

O modelo mental: você não está escrevendo prompts, está escrevendo loops

Aqui está a mudança que precisei de uma segunda execução para realmente sentir.

Quando você escreve um prompt, dá instruções ao Claude: faça isto, depois aquilo, formate assim. Você é responsável pela qualidade do resultado. Se está errado, é porque seu prompt estava errado.

Um loop inverte isso. Você dá ao Claude um objetivo, algum contexto e um conjunto de critérios de sucesso — e então o Claude é responsável pela qualidade. Ele planeja, escolhe ferramentas, as executa, avalia sua própria saída contra os critérios que você deu, e se ficar aquém, tenta novamente. O loop continua girando até a saída superar a barra ou o orçamento acabar.

Três inputs alimentam cada loop:

Contexto — informações de fundo que o agente precisa. Para meu resumo: "o público são construtores indie de IA, priorize posts com menos de 24 horas, ignore threads de memes."
Objetivo — o que você realmente quer que seja produzido. "Cinco posts em alta, cada um com um resumo de duas linhas e um ângulo de gancho."
Critérios de sucesso — como o agente sabe que fez um bom trabalho. "Cada entrada tem um link fonte funcional, um ângulo distinto e pode ser lida em menos de quinze segundos."

Esse terceiro input é o que todos subestimam. Sem critérios de sucesso explícitos, o agente não tem nada contra o que se avaliar, então o loop para cedo demais ou gira infinitamente. A Launch Your Agent skill gasta uma boa parte da entrevista extraindo esses critérios de você, e esse interrogatório é, honestamente, a coisa mais valiosa que ela faz — mais sobre isso abaixo.

Pense nisso como a diferença entre dar a um funcionário júnior uma checklist versus dar a ele uma definição de "pronto" e a autoridade para descobrir os passos. A checklist escala pior. A definição de pronto escala, mas só se você a escrever com precisão. O loop é a segunda coisa, produtizada.

Agora, teoria é barata. Deixe-me mostrar o que aconteceu quando eu realmente instalei.

Como instalei a Launch Your Agent skill no Claude Code

Fiz isso em uma máquina limpa — Claude Code v2.1.101, macOS, logado — especificamente para poder anotar cada passo em vez de passar por cima da parte "e então simplesmente funciona". Tempo total do clone até a primeira pergunta da entrevista: menos de três minutos.

Passo 1 — Clone o repositório e abra o Claude Code. O repositório é pequeno. Não há npm install, não há etapa de build, nada para compilar.

# Clone o repositório de referência da Anthropic
git clone https://github.com/anthropics/launch-your-agent
cd launch-your-agent

# Inicie o Claude Code de dentro do repositório
claude

A razão pela qual você inicia o Claude Code de dentro do repositório é que o Claude Code auto-descobre skills em um diretório .claude/skills/. Não há um comando separado de "instale esta skill" — coloque os arquivos no lugar certo, inicie o Claude Code, e ele os detecta. Essa é toda a "instalação."

Passo 2 — Invoque a skill. Dentro da sessão do Claude Code, digite:

/launch-your-agent

Isso inicia a skill principal de quatro fases. O complementar /wrap-up também fica disponível — você o executa depois que seu agente está ativo para obter um resumo de status.

Passo 3 — Conecte uma chave de API. Este é o passo que os tutoriais rápidos pulam, e é o que realmente custa dinheiro. A skill faz deploy no Claude Managed Agents, e o CMA roda na sua própria conta da Anthropic. Então você precisa de uma chave de API de platform.claude.com → API keys. Crie uma, e a skill a armazena localmente em um arquivo .env — nunca colada na transcrição do chat, que é a decisão certa para uma credencial.

Dica profissional: antes de gerar essa chave, defina um limite de gasto rígido na própria chave de API no Console. Eu não fiz isso na primeira vez. Você pode adivinhar para onde isso vai.

Passo 4 — Responda a entrevista. Uma vez que a chave está configurada, a skill começa a fazer perguntas. É aqui que o trabalho real acontece, e merece sua própria seção.

Se você já usou skills do Claude Code antes, nada disso vai te surpreender — é o mesmo padrão de descoberta .claude/skills/ que cobri na minha análise de Agent Skills avançadas no Claude Code. O que é novo é o que a skill faz com esse padrão: ela não te ajuda a escrever código, ela te entrevista até um deploy.

A entrevista é o verdadeiro produto

Entrei esperando um assistente de configuração glorificado. O que recebi pareceu mais com um PM afiado me encurralando em um corredor até eu admitir o que realmente queria.

A skill — rodando como Fase 1 de quatro (Interview → Stage & Launch → Grade & Iterate → Run Without You) — trabalhou aproximadamente estas áreas:

O que o agente faz? Não "resuma o Reddit" mas a forma específica do output. Ela empurrou de volta quando minha primeira resposta foi vaga.
Qual é o formato de saída? Digest em Markdown? Email? Uma linha em uma planilha? Ela queria o artefato, concreto.
Quem é o público e quais são as fontes de dados? Aqui eu disse "construtores indie de IA" e "Reddit, especificamente r/LocalLLaMA e r/ChatGPT."
Quais são os critérios de sucesso e a rubrica de avaliação? A parte que mencionei antes. Ela me forçou a definir como um digest bom se parece versus um medíocre, em termos contra os quais pudesse realmente pontuar.
Com que frequência deve rodar? Diário, semanal, sob demanda. Escolhi diário às 7h.

Então ela fez algo que eu não esperava: definiu uma v0 — uma primeira versão deliberadamente mínima — em vez de tentar construir meu agente dos sonhos completo na primeira tentativa. Ela me disse, essencialmente, "vamos colocar a menor versão útil no ar, avaliar e depois escalar." Isso é boa disciplina de engenharia embutida em uma skill, e é a principal razão pela qual um não-programador pode usar isso sem produzir uma bagunça emaranhada.

Quando a entrevista terminou, a skill gerou uma pasta my-agent/. Quero ser específico sobre o que está nela, porque esta é a parte que torna a coisa legível em vez de mágica:

Uma folha de construção — a especificação legível por humanos do que está sendo implantado.
Os payloads exatos da API — o JSON literal que a skill envia para a API do CMA. Você pode ler, auditar e reutilizar.
Um script de lançamento retomável — para que se um deploy morrer no meio, você o execute novamente em vez de recomeçar.
Um scaffold de avaliação — o arnês de avaliação que pontua cada execução contra seus critérios.
Uma página de visão geral — um resumo gerado tipo dashboard.
NEXT-DIRECTIONS.md — um roadmap v1/v2 de melhorias para depois.

Essa pasta é a diferença entre "uma IA fez algo opaco na nuvem" e "aqui está a definição exata, inspecionável e controlável por versão do meu agente." Não consigo enfatizar o suficiente quanto essa transparência de artefatos importa quando você está gastando dinheiro real em execuções.

Você passou pelo setup. Agora a parte honesta — o que aconteceu quando eu realmente deixei rodar.

O que aconteceu quando lancei meu primeiro agente

A Fase 2 (Stage & Launch) enviou meu v0 para o Claude Managed Agents. No Console, apareceu um novo agente com seu ambiente, e a skill disparou a primeira execução avaliada.

Então me recostei para observar o dashboard, que mostra histórico de sessões, chamadas de API e resultados por execução. E aqui é onde a lacuna entre demo e realidade se abriu.

A tarefa do agente precisava de dados do Reddit. O agente não conseguia obter dados do Reddit de forma confiável. Os endpoints do Reddit continuavam recusando as requisições — limites de taxa, bloqueios de acesso, a hostilidade usual que APIs públicas mostram a qualquer coisa que cheira a automação. Então o loop fez exatamente o que loops fazem: falhou em um passo, avaliou e tentou novamente. E de novo. Cada retry queimou tokens.

Três números duros daquela primeira execução, e estou te dando os reais, não os lisonjeiros:

~28 minutos de tempo real, quase todo gasto em retries e tratamento de erros, não em trabalho produtivo.
~$12 em custo de API por uma única execução, impulsionado pelo alto uso de tokens enquanto o loop mastigava raciocínio de classe Opus em cada retry. (Opus 4.8 custa $5 entrada / $25 saída por milhão de tokens, e um loop travado gera muitos tokens de saída.)
5 histórias em alta no digest final — porque apesar do caos, eventualmente produziu uma saída utilizável, com links e comentários.

Então: funcionou. Também custou mais que um mês de algumas assinaturas SaaS, por um único resumo diário. Se isso rodasse toda manhã sem supervisão, eu estaria olhando para aproximadamente $360 por mês por um resumo do Reddit. Isso não é um erro de digitação, e é o tipo de matemática que ninguém menciona nos threads de lançamento.

Aqui está a parte que o redimiu, porém. A Fase 3 da skill (Grade & Iterate) não simplesmente me entregou a bagunça cara e deu de ombros. Ela avaliou a execução, notou que as falhas do Reddit eram o fator de custo, e recomendou trocar a fonte de dados para apenas busca web — eliminar a dependência instável do Reddit, puxar discussões em alta via busca em vez disso, reduzir tanto a taxa de erros quanto o consumo de tokens. O agente diagnosticou seu próprio modo de falha mais caro e propôs a correção. Isso é o loop provando seu valor.

A opinião honesta: onde esta skill é brilhante e onde ela morde

Já executei isso em três ideias de tarefas diferentes — o digest do Reddit, um observador de preços de concorrentes e um resumidor diário de changelog para um repositório que sigo. Padrões emergiram. Deixe-me te dar as compensações que ninguém coloca em suas manchetes.

O que genuinamente acerta:

O pipeline de entrevista para deploy é a verdadeira inovação, não a hospedagem na nuvem. Já vi muitas ferramentas de "agente de IA sem código", e todas falham da mesma forma: tornam fácil começar e impossível saber se o resultado é bom. Esta skill inverte isso forçando critérios de sucesso de antemão e então avaliando contra eles. Os artefatos de my-agent/ significam que você nunca fica preso — pode ler os payloads exatos, versioná-los no git e abandonar a skill completamente enquanto mantém o agente. Esse é um design incomumente honesto para algo voltado a iniciantes.

Onde morde — e isso é real:

A confiabilidade de ferramentas de terceiros é seu problema, não da skill. O muro do Reddit não foi um bug no Launch Your Agent. É a realidade de que a web aberta combate o acesso automatizado, e um loop que retenta falhas vai felizmente transformar essa fricção em uma fogueira de tokens de cinco dígitos. Antes de apontar um agente para uma fonte de dados, pergunte-se: essa fonte vai deixar um bot entrar? Se a resposta é instável, o loop vai descobrir da maneira cara.

O modelo de custos recompensa precisão e pune vagueza. Um objetivo apertado com critérios de sucesso claros converge em poucas iterações baratas. Um objetivo vago gira sem parar. Como o agente é responsável pela qualidade, uma definição vaga de "pronto" significa que ele continua tentando atingir um alvo que você nunca desenhou claramente. Seu gasto é diretamente proporcional a quão desleixadas foram suas respostas na entrevista. Se você leva a sério manter essas contas gerenciáveis, meu guia de otimização de custos de agentes IA cobre as táticas de disciplina de tokens que mais importam aqui.

"Implementação de referência, sem manutenção" é uma ressalva real. O repositório diz isso diretamente. Isso é a Anthropic te mostrando um padrão, não entregando um produto suportado. Quando a API do CMA mudar — e uma API em beta pública vai mudar — a skill não receberá um patch. Você está adotando um snapshot. Bom para aprender e prototipar. Pense melhor antes de construir um fluxo de trabalho crítico para o negócio em cima de um scaffold explicitamente sem manutenção.

Se você prefere ter alguém que projete esses agentes para que convirjam de forma econômica e não travem em fontes de dados instáveis, isso é uma boa parte do que construo para clientes — você pode ver o tipo de trabalho de automação que aceito em fiverr.com/s/EgxYmWD.

Essa é a experiência. Agora deixe-me dar zoom out para o que significa em termos de como você deveria realmente usar a coisa.

Quando esta skill vale a pena (e quando um cronjob vence)

O erro que quase cometi foi tratar o Launch Your Agent como substituto para toda automação. Não é. Aqui está o framework de decisão no qual cheguei depois de três execuções.

Use a skill quando:

A tarefa é genuinamente intensiva em julgamento — resumir, priorizar, triar, escrever — onde um script determinístico não consegue capturar "bom." O loop de avaliação justifica seu custo quando a qualidade é subjetiva.
A tarefa se repete e você de outra forma ficaria supervisionando. Os deploys agendados do CMA (horários cron, agora em beta pública desde 9 de junho de 2026) permitem que um agente dispare sozinho; você obtém pausar, retomar, arquivar e reexecuções sob demanda, com um limite organizacional de 1.000 deploys agendados.
As fontes de dados são amigáveis à automação — suas próprias APIs, busca web, serviços com credenciais injetadas via vault (CMA pode injetar secrets no sandbox em tempo de execução sem que o modelo os veja).

Pule e escreva o cronjob quando:

A tarefa é determinística. Se um script de quarenta linhas produz exatamente a resposta certa toda vez, um loop LLM é uma maneira estritamente mais cara de obter um resultado pior definido. Não pague tarifas de Opus para fazer if/else.
A fonte de dados é hostil a bots (estou olhando para você, Reddit) e você não tem acesso legítimo à API. O loop vai retentar dentro da sua carteira.
Você precisa de custos apertados e previsíveis. Um script custa centavos em computação. Um loop de raciocínio custa o que for necessário para satisfazer seus critérios, o que você não pode prever perfeitamente de antemão.

Isso se conecta com uma mudança maior sobre a qual continuo escrevendo: a unidade de automação está se movendo de scripts que você mantém para objetivos que você delega. Aprofundei no lado sempre ativo e agendado disso no meu artigo sobre rodar loops do Claude Code em um horário cron. A Launch Your Agent skill é a rampa de acesso mais amigável a esse mundo que encontrei — desde que você entre sabendo que é um táxi com taxímetro, não uma assinatura de tarifa fixa.

O que eu te aconselharia a realmente fazer

Não faça deploy de um agente diário na sua primeira execução. Esse foi meu erro, e é evitável.

Aqui está a sequência que teria me poupado onze dólares e muito ficar olhando o dashboard:

Instale a skill e execute a entrevista com uma tarefa real — mas para o primeiro agente, escolha algo com uma fonte de dados amigável. Seus próprios arquivos, sua própria API ou busca web simples. Não Reddit. Não nada que combata scrapers.
Defina um limite de gasto na chave de API no Console primeiro. Um limite de $5 em uma chave nova transforma "perdi o controle do custo" em "a execução parou sozinha." Seguro barato.
Execute uma vez, sob demanda. Leia a saída avaliada e a pasta my-agent/. Trate a primeira execução como uma lição paga sobre como o loop se comporta com sua tarefa, não como produção.
Só então agende. Uma vez que você viu uma execução limpa e barata, ative o deploy cron. Agora você está automatizando uma quantidade conhecida em vez de um ponto de interrogação.
Execute /wrap-up para obter o resumo e as próximas melhorias sugeridas, e então decida se a v1 vale o gasto.

A lição maior por baixo de tudo isso: a skill não tornou a automação fácil. Ela tornou fácil definir o objetivo — e então expôs impiedosamente cada lugar onde minha definição era desleixada, me cobrando pelo desleixo em tokens reais. Isso não é um defeito. É o loop de feedback mais honesto que recebi de uma ferramenta de IA em um bom tempo.

Então aqui está a pergunta que deixo com você, a mesma que o agente basicamente me fez no minuto dezenove: se você tivesse que escrever os critérios de sucesso exatos para uma tarefa que faz todos os dias — a definição precisa de "bem feito" — conseguiria? Porque no momento em que conseguir, pode entregá-la a um loop. E no momento em que não conseguir, terá encontrado a parte do seu trabalho que nunca seria automatizada de qualquer forma.

Perguntas Frequentes

O que é a Launch Your Agent skill para Claude Code?

A Launch Your Agent skill é um conjunto gratuito e de código aberto de skills para Claude Code da Anthropic que te entrevista sobre uma tarefa e a implanta como um Claude Managed Agent ativo e hospedado na nuvem sem nenhum código. Inclui duas skills, launch-your-agent e wrap-up, sob uma licença Apache 2.0 em github.com/anthropics/launch-your-agent. Para o guia completo de instalação, consulte a seção de instalação acima.

A Launch Your Agent skill é gratuita?

A skill em si é gratuita e de código aberto, mas faz deploy no Claude Managed Agents, que te cobra tarifas padrão de tokens da API Claude mais $0,08 por hora de sessão na sua própria conta da Anthropic. Minha primeira execução real custou cerca de $12 porque o loop ficava retentando uma fonte de dados instável — então "skill gratuita" não significa "grátis para rodar."

Como instalo a Launch Your Agent skill?

Clone o repositório com git clone https://github.com/anthropics/launch-your-agent, faça cd nele, execute claude para abrir o Claude Code de dentro da pasta, e então digite /launch-your-agent. O Claude Code auto-descobre skills em .claude/skills/, então não há um passo de instalação separado. Você também precisará de uma chave de API da Anthropic de platform.claude.com.

O que é um Claude Managed Agent (CMA)?

Um Claude Managed Agent é um agente hospedado na nuvem que a Anthropic executa em um container isolado em sua própria infraestrutura, cuidando de sandboxing, estado e execução de ferramentas, enquanto te cobra por token mais $0,08 por hora de sessão. Desde junho de 2026, o CMA suporta deploys agendados tipo cron e credenciais injetadas via vault em beta pública. A Launch Your Agent skill é uma forma de criar um.

Por que minha execução do Launch Your Agent custou tanto?

As execuções ficam caras quando o loop retenta repetidamente um passo que falha — no meu caso, o Reddit recusou as requisições do agente, e cada retry queimou tokens de classe Opus a $5 entrada / $25 saída por milhão. Critérios de sucesso vagos pioram, porque o loop continua tentando atingir um alvo indefinido. Critérios apertados e fontes de dados amigáveis à automação mantêm os custos baixos.

Vamos Trabalhar Juntos

Procurando construir sistemas de IA, automatizar fluxos de trabalho ou escalar sua infraestrutura tech? Adoraria ajudar.

Fiverr (builds personalizados e integrações): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (soluções empresariais): ramlit.com
ColorPark (design e branding): colorpark.io
xCyberSecurity (serviços de segurança): xcybersecurity.io

Launch Your Agent: Testei a Skill Gratuita da Anthropic