Super Skills no Claude Code: meu build log real

Eu tinha 47 habilidades instaladas no ~/.claude/skills/ na última sexta-feira. Excluí 39 deles na manhã de domingo.

Não porque eles estavam quebrados. Eles funcionaram exatamente como a documentação dizia que funcionariam. Uma habilidade chamada meeting-summary produziu um resumo da reunião. Uma habilidade chamada seo-audit produziu uma auditoria de SEO. Uma habilidade chamada linkedin-post produziu uma postagem LinkedIn. Eles se comportaram. Eles retornaram o formato correto de saída. Eles nunca lançaram erros.

Eles também nunca melhoraram.

Toda segunda-feira eu escreveria as mesmas notas de correção na mesma sessão Claude Code. "Não use a palavra alavancagem. Pare de abrir cada parágrafo com uma pergunta. Corte os travessões pela metade." Na terça-feira de manhã, a habilidade faria todas as três coisas novamente, exatamente como fez na semana anterior. A habilidade não tinha ideia de que segunda-feira havia acontecido.

Essa é a lacuna que Jack Roberts apontou no resumo do vídeo que chegou à minha caixa de entrada na semana passada. Ele chama isso de diferença entre uma habilidade utilitária e uma super habilidade, e enquadra tudo por meio dos modelos mentais de Andrej Karpathy para trabalhar com agentes de codificação. Assisti duas vezes e depois passei quatro dias reconstruindo todo o meu diretório de habilidades em torno da ideia. Este é o log de construção.

Se você leu minhas notas de instalação do Karpathy CLAUDE.md, você já sabe que levo a sério os princípios do agente de codificação do Karpathy. Esta postagem é a próxima camada - o que acontece quando você para de aplicar esses princípios ao seu código e começa a aplicá-los às próprias habilidades.

Por que 99% das skills Claude são estáticas, esquecidas e silenciosamente inúteis

Abra ~/.claude/skills/ na máquina de qualquer usuário Claude Code agora e você encontrará aproximadamente a mesma imagem. Uma pasta por habilidade. Um arquivo SKILL.md dentro de cada um. Frontmatter YAML na parte superior com um nome e uma descrição. Algumas centenas de palavras de instruções abaixo. Talvez um diretório templates/ com algum padrão.

Esse é o formato oficial. A documentação de habilidades Claude Code descreve exatamente dessa maneira: um SKILL.md com frontmatter que informa ao Claude quando carregar a habilidade, além do conteúdo de redução que Claude lê quando a habilidade é chamada. A ferramenta Habilidade mostra isso. O chicote carrega o arquivo. O modelo lê as instruções. A habilidade é executada.

Funciona. É também onde 99% dos usuários do Claude Code param de construir.

Aqui está o que uma habilidade estática não pode fazer. Ele não consegue lembrar o que você disse na última sessão. Ele não pode extrair dados atuais de um encadeamento Gmail ou de um arquivo Figma ou da pesquisa na web da semana passada. Ele não pode avaliar sua própria saída e reescrever-se quando a saída continua voltando errada. É um prompt congelado com um nome inteligente. O modelo subjacente fica mais inteligente a cada seis meses. A habilidade permanece exatamente tão idiota quanto no dia em que você a escreveu.

O enquadramento do Roberts foi o que finalmente fez com que ele clicasse para mim. Uma habilidade estática é um utilitário — ela resolve uma tarefa, da mesma maneira, sempre, como um encurtador de URL Bitly que pega uma URL longa e exibe uma curta. Útil. Previsível. Esquecível. Uma super habilidade é algo diferente. Tem memória que pode recordar. Ele utiliza as ferramentas certas e as fontes de dados certas para a tarefa específica que tem pela frente. E ele avalia seu próprio resultado e se refina com base no seu feedback.

Três propriedades. Memória. Ferramentas. Autoaperfeiçoamento. Sem eles, você estará digitando prompts com etapas extras.

A maioria das minhas 47 habilidades tinha zero das três.

O framework de Karpathy que mudou como escrevi cada SKILL.md

Antes de tocar em um único arquivo de habilidade, tive que consertar a escrita em si. Porque o segundo erro que cometi - aquele por trás do problema de memória e ferramentas - foi que minhas instruções de habilidades pareciam estagiários ansiosos tentando impressionar um gerente. Longo. Especulativo. Recheado de ramificações do tipo "considere também" e sugestões do tipo "você pode querer". Cada habilidade consistia em 800 palavras de orientação protegida.

As observações públicas de Karpathy sobre agentes de codificação LLM estão circulando no X há mais de um ano, e o repositório andrej-karpathy-skills de Forrest Chang as destilou em quatro princípios que 60.000 desenvolvedores já marcaram, de acordo com o artigo do Robonuggets. Os quatro princípios:

Pense antes de codificar. Esclareça suposições. Indique o objetivo. Nomeie as restrições. Não comece a digitar até que você consiga articular como é o sucesso.
Simplicidade em primeiro lugar. Código mínimo que resolve o problema. Nada especulativo. Nenhum recurso além do que foi solicitado.
Edições cirúrgicas. Toque apenas no que for necessário. Não "melhore" o código, os comentários ou a formatação adjacentes. Cada linha alterada rastreia a solicitação.
Execução orientada por metas. Defina os critérios de sucesso antecipadamente. Faça um loop até ser verificado. Pare quando terminar.

Eu estava tratando isso como regras para as gravações do código Claude. O enquadramento do Roberts inverteu isso. Elas também são regras para a própria habilidade.

Cada SKILL.md que reescrevi ficou mais curto. A habilidade "meeting-summary" passou de 612 palavras para 184. A habilidade "seo-audit" passou de 891 palavras para 240. Cortei ramos especulativos. Cortei "caso você também queira". Nomeei os critérios de sucesso explicitamente no topo de cada arquivo. Os próprios arquivos de habilidades agora seguem a disciplina de edição cirúrgica – eles dizem o que precisam dizer e nada mais.

A produção melhorou mensuravelmente na mesma semana. Não porque o modelo ficou mais inteligente. Porque o modelo finalmente tinha instruções menos ambíguas para analisar.

Essa foi a base. Agora poderíamos construir as três propriedades de super-habilidades em cima dele.

Propriedade um: memória que realmente lembra

Uma habilidade sem memória é um peixinho dourado em um aquário. Toda segunda-feira ele encontra você pela primeira vez. Todas as terças-feiras ele faz as mesmas perguntas de contexto. Toda quarta-feira ele comete os mesmos erros que você corrigiu na segunda-feira.

Roberts' Memory OS é a arquitetura em torno da qual reconstruí e é a única mudança que mais agravou. Três baldes. Cada bucket tem uma função clara, um ciclo de vida claro e uma regra clara para o que acontece.

Balde Um: Memória da Sessão

Este é o próprio registro da conversa, arquivado ao final de cada sessão de trabalho. O mecanismo é uma habilidade simples - Roberts a chama de habilidade de "finalização" - que é executada no final de cada sessão Claude Code e faz três coisas. Ele grava o resumo da conversa em um arquivo markdown datado. Ele extrai as correções que você deu ao modelo e as salva como exemplos rotulados. Ele atualiza uma contagem de sessões em execução.

Liguei o meu para disparar em /wrap no final de cada bloco de trabalho. A saída vai para ~/Documents/claude-memory/sessions/2026-04-28-skills-rebuild.md. A coisa toda leva cerca de 40 segundos. Na manhã seguinte, quando inicio uma nova sessão, minha habilidade Perfil (mais sobre isso abaixo) lê o arquivo da sessão mais recente antes de fazer qualquer outra coisa. A modelo entra já sabendo o que fizemos ontem.

Este é o balde que eu perdi completamente por um ano. Todos os outros experimentos de memória que executei - cofres Obsidian, bancos de dados Notion, o sistema de memória ilimitada Pinecone que construí há três semanas - todos eles resolveram a recuperação de longo prazo. Nenhum deles resolveu “lembre-se do que acabamos de falar”. A memória de sessão preenche essa lacuna com uma habilidade de finalização e uma pasta.

Grupo Dois: Base de Conhecimento

Este é o balde imutável. Formato longo, durável, não muda. Minha base de conhecimento contém: meus próprios escritos (cada postagem de blog neste site, cada boletim informativo), transcrições de todos os vídeos e podcasts que publiquei, os livros que anotei e algumas centenas de referências técnicas às quais sempre volto. Não contém notas de rascunho. Não contém meias reflexões. Se for para a base de conhecimento, permanecerá lá.

Testei dois back-ends de armazenamento frente a frente. Obsidian por meio da configuração de memória persistente Obsidian-Claude Code e Pinecone sem servidor. O veredicto foi aquele que a maioria das pessoas não quer ouvir: Obsidian é ótimo quando sua base de conhecimento cabe em uma tela. Depois de cruzar algumas centenas de arquivos de markdown longos, o custo do token para permitir que o Claude verifique o conteúdo do vault em cada consulta relevante fica feio rapidamente. Executei uma semana de registro duplo e o caminho Obsidian estava me custando cerca de 4x os tokens do caminho Pinecone nas mesmas questões, porque a recuperação Obsidian acaba carregando arquivos inteiros onde Pinecone retorna pedaços classificados.

Pinecone vence em escala. A página pública de preços da Pinecone lista o nível Starter como gratuito com 5 índices, 2 GB de armazenamento, 2 milhões de unidades de gravação e 1 milhão de unidades de leitura por mês, e o nível Standard por US$ 50/month com recursos de produção e multinuvem. Estou executando no Standard. Para uma base de conhecimento com menos de 500 documentos, você pode ficar no Starter. O modelo sem servidor significa que não há cobrança de computação ociosa, o que é importante porque a maior parte do meu tráfego de recuperação é intermitente – uma enxurrada de consultas na manhã de terça-feira, perto de zero na tarde de sábado.

Se você tem menos de 200 arquivos longos e não se importa com o gasto maior de tokens, continue no Obsidian. Depois de 200, o Pinecone serverless economiza dinheiro real.

Grupo Três: Perfil e Estratégia

Este é o balde mutável – e foi aquele que subestimei. Um arquivo de redução. Mora em ~/.claude/profile.md. Atualizado ao final de cada sessão. Contém: meu foco atual (o projeto no qual estou trabalhando esta semana), as metas ativas (o que estou tentando entregar), as restrições (o que está me bloqueando) e as decisões recentes (o que combinamos ontem para não religá-lo hoje).

Este arquivo é o que minhas super habilidades leem primeiro. Antes de qualquer tarefa, a habilidade verifica o perfil, sabe no que estou trabalhando e pula as perguntas “o que você está tentando fazer”. A transformação no ritmo é enorme. Uma habilidade pós-LinkedIn que costumava fazer três perguntas de configuração agora produz um rascunho no primeiro turno porque ela já sabe que estou escrevendo sobre habilidades Claude Code esta semana.

A visualização do painel de tudo isso – Roberts mostra em seu vídeo – é o que faz o Memory OS parecer um sistema operacional em vez de uma pilha de pastas. Contagens de sessão. Insights do cliente agregados da memória da sessão. Notas de crescimento de assinantes. Mapas de calor dos tópicos em que mais trabalho. Eu construí uma versão simplificada usando uma habilidade dashboard que apenas lê os três buckets e renderiza um resumo de redução. Não é bonito, mas o suficiente para ver o formato da minha semana de trabalho.

Propriedade dois: as ferramentas e fontes de dados certas por tarefa

A memória é metade da equação. A outra metade é a habilidade de saber o que fazer para a tarefa específica que tem pela frente.

Uma habilidade estática opera em tudo o que você cola no prompt. Uma super habilidade sabe: esta tarefa precisa de Gmail, esta tarefa precisa do arquivo Figma, esta tarefa precisa da página de preços mais recente do site de um concorrente. Ele mesmo puxa essas coisas.

Os conectores integrados do aplicativo de desktop Claude lidam com a maioria dos casos fáceis. Gmail, Google Calendar, Google Drive, Notion, Slack, Figma – todos disponíveis como ferramentas no estilo MCP que a habilidade pode declarar que precisa. Quando o conector existe, você conecta a habilidade diretamente a ele e os dados aparecem no tempo de execução.

O que fica interessante são os casos que os conectores não cobrem. A pesquisa na web é a grande. Se sua habilidade precisa da página de preços atual de uma ferramenta, ou das notas de lançamento do mês passado de um fornecedor, ou das 5 principais postagens de blog do concorrente sobre um tópico, você está se esforçando. E a extração com busca bruta consome tokens - cada página retorna como 30 KB de HTML, navegação, rodapés e scripts embutidos. O modelo precisa percorrer 80% do ruído para encontrar 20% do sinal.

Firecrawl é o raspador otimizado para AI para o qual mudei. Ele retorna uma redução limpa. Ele remove a navegação e os anúncios. O arranhão que costumava ser um blob HTML de 30 KB retorna como 4 KB de conteúdo real, o que significa cerca de 7 vezes menos tokens por página em tarefas de pesquisa na web. Seu preço público em abril de 2026 lista Gratuito com 500 créditos únicos, Hobby por $ 16/month por 3.000 créditos, Padrão por $ 83/month por 100.000 créditos e Crescimento por $ 333/month por 500.000 créditos. A raspagem padrão é de 1 crédito por página. A pesquisa custa 1 crédito por resultado. A extração JSON adiciona 4 créditos por página no topo.

Estou no Hobby. 3.000 créditos por mês são suficientes para um fluxo de trabalho de pesquisa pessoal com algumas habilidades diárias de extração da web. Se você dirige uma equipe de conteúdo de uma agência, Padrão é o piso realista.

Para os conectores que não existem diretamente, Zapier é a ponte universal. Qualquer coisa que você possa conectar a um Zap, você pode conectar a uma habilidade Claude via webhook. Eu tenho uma habilidade "postar no X com imagem" que usa Zapier como ponte porque ainda não existe um conector X nativo que valha a pena usar. Configuração em duas etapas. Funciona.

O criador de habilidades integrado ao Claude é a maneira mais rápida de criar um novo - ele orienta você na declaração de intenção, resultado esperado, ferramentas necessárias, fontes de dados e formato de saída. Abordei o lado do teste em meu passo a passo de habilidades de teste, e a mesma disciplina de teste é ainda mais importante para super habilidades, porque uma vez que você fornece memória e ferramentas a uma habilidade, a área de superfície para comportamento surpresa triplica.

Propriedade três: o ciclo de refinamento que compõe

Esta é a propriedade que transforma uma habilidade em algo que realmente melhora com o tempo. E é aquele que a maioria das pessoas ignora porque parece um excesso de engenharia até que você viva sem ele.

O ciclo de refinamento tem um conceito simples. Depois que a habilidade produz a saída, ela é avaliada de acordo com os critérios de sucesso definidos em SKILL.md. Se a nota estiver abaixo do limite, ele solicitará a correção específica. A correção é registrada. Periodicamente – semanalmente é o que eu executo – a habilidade lê seu próprio log de correção e reescreve as seções relevantes de seu SKILL.md para codificar a lição.

Na prática, minha versão é uma habilidade refine que aciono explicitamente nas tardes de sexta-feira. Ele lê as correções da memória da sessão da semana anterior, agrupa-as de acordo com a habilidade à qual se aplicaram e propõe uma comparação para cada SKILL.md afetado. Eu reviso as diferenças. Aceito aqueles que correspondem ao que eu realmente quero. A habilidade se reescreve. Na próxima segunda-feira, o perícia entra lembrando da correção.

Esta é a parte do sistema onde a composição aparece. Após três semanas de refinamento, minha habilidade de postagem LinkedIn parou de abrir todas as postagens com perguntas. Depois de duas semanas, minha habilidade de auditoria de SEO parou de preencher o relatório com seções de resumo que eu nunca li. Depois de uma semana, minha habilidade meeting-summary parou de colocar itens de ação no topo porque eu disse que os lia por último e os queria por último. Nenhuma dessas mudanças exigiu que eu tocasse diretamente no SKILL.md. Eu dei a correção uma vez em uma conversa. A habilidade de encerramento capturou isso. A habilidade de refinar codificou isso. A habilidade se comportou de maneira diferente na sessão seguinte.

Isso é o que Roberts quer dizer quando diz composto de super habilidades. A habilidade estática é a mesma no dia 1 e no dia 90. A super habilidade no dia 90 é significativamente melhor do que a mesma habilidade no dia 1 - não porque o modelo ficou mais inteligente, mas porque a habilidade consumiu três meses de suas correções.

Se você quiser ver esse padrão em ação sem a camada de memória, meu [registro de sistemas Claude Code de autoaperfeiçoamento] mais antigo (https://www.mejba.me/self-improving-claude-code-systems) percorre uma versão menor do mesmo loop. O Memory OS transforma isso de um truque de habilidade única em uma propriedade do sistema.

Onde errei no primeiro build

Três dias depois, tive que demolir a maior parte e reiniciar. Vale a pena sinalizar os erros caso você esbarre nas mesmas paredes.

Erro um: tornei a habilidade de encerramento muito inteligente. A primeira versão tentou resumir, extrair correções, atualizar o perfil e atualizar o painel em uma única passagem. Demorou 4 minutos por final de sessão e os resumos continuavam faltando coisas porque o modelo estava fazendo malabarismos com quatro tarefas. Eu o dividi em três habilidades menores - wrap (apenas o arquivo de conversa), extract-corrections (apenas a correção), update-profile (apenas a diferença de perfil). Cada um é executado em 30 a 50 segundos. Nenhum deles deixa cair informações.

Erro dois: joguei tudo na base de conhecimento. Nos primeiros dois dias, indexei notas do bloco de notas do bate-papo, rascunhos incompletos e trechos aleatórios do Slack. A recuperação da pinha ficou barulhenta porque os encaixes estavam poluídos com material de baixa qualidade. Eu limpei tudo no terceiro dia e agora existe uma regra rígida: nada entra na base de conhecimento, a menos que seja algo ao qual eu vincularia um estranho. A qualidade da recuperação aumentou imediatamente.

Erro três: tentei pular o ciclo de refinamento porque "Vou editar o SKILL.md diretamente quando notar problemas". Eu disse isso a mim mesmo e então comecei a nunca editar um SKILL.md diretamente por uma semana inteira, porque toda vez que percebia um problema, eu estava no meio da tarefa e não estava com vontade de mudar de contexto para editar arquivos de prompt. A habilidade de refinar funciona porque agrupa a edição em uma única sessão de sexta-feira. Sem esse mecanismo de lote, as habilidades não melhoram. Eles apenas coletam queixas.

Erro quatro: subestimei o desvio do perfil. O arquivo de perfil fica obsoleto rapidamente se você não o atualizar. Depois de uma semana sem atualização, a modelo começou a me dar conselhos para o projeto da semana passada, em vez do desta semana. Agora tenho uma automação que me avisa com uma notificação se o perfil não for tocado em 48 horas. Sem o empurrãozinho, todo o sistema degrada lentamente de volta ao território de habilidades estáticas.

Se você preferir que alguém construa esse tipo de sistema do zero para sua equipe, em vez de fazer você mesmo, assumo compromissos Claude Code por meio de meu Fiverr. Habilidades, sistema operacional de memória, fiação Pinecone, loop de refinamento - a mesma pilha que executo em meu próprio trabalho, configurada para o seu.

O que o curso de Roberts acrescenta ao que o autodidatismo perde

Contexto rápido de onde tudo isso veio. Roberts executa um curso Claude Code que vai desde as fundações até a monetização, e a seção de super-habilidades está aproximadamente no meio dele. Não fiz o curso completo. Peguei o quadro de superhabilidades de seu vídeo público e o reconstruí a partir daí. O que eu diria honestamente: a moldura é a parte valiosa. Depois de ter as três propriedades nomeadas (memória, ferramentas, autoaperfeiçoamento) e a arquitetura do Memory OS (sessão, base de conhecimento, perfil), o resto é uma questão de fazer o trabalho.

Se você é o tipo de construtor que gosta de uma sequência guiada com ciclos de feedback integrados, um curso pago vai economizar os quatro dias que passei trabalhando no design de habilidades finais. Se você preferir ler um log de construção, aprender o quadro e trabalhar na implementação sozinho, esta postagem é mais ou menos isso.

Qualquer caminho leva você até lá. O objetivo é parar de executar 47 habilidades utilitárias que todos esquecem que você existe entre as segundas-feiras.

O único movimento que mudou tudo

Se você tirar exatamente uma coisa desta postagem, pegue isto:

Desenvolva primeiro a habilidade de encerramento. Antes da integração da Pinecone. Antes da fiação do Firecrawl. Antes do painel. Antes de reescrever uma única habilidade existente.

A habilidade de finalização é a coisa mais barata desta lista e também é a base sobre a qual todo o resto se baseia. Sem ele, suas sessões não geram nada. Suas correções evaporam. Seu perfil fica obsoleto. O loop de refinamento não tem nada para refinar de. O Memory OS possui memória de sessão porque a habilidade de finalização a grava.

São 50 linhas de SKILL.md. Ele é executado em /wrap. Ele grava um arquivo markdown por sessão em uma pasta. Esse é o MVP completo. Construa isso esta semana. Execute-o por duas semanas. Em seguida, coloque o arquivo de perfil. Em seguida, adicione a base de conhecimento. Em seguida, coloque o loop de refinamento. Cada camada se torna possível porque a camada anterior a alimenta.

O problema das 47 habilidades que esquecem que você existe não é resolvido escrevendo a habilidade nº 48. O problema é resolvido dando às habilidades que você já possui uma maneira de lembrar de segunda a terça.

Essa é a diferença entre uma utilidade e uma super habilidade. E tudo começa com um arquivo de encerramento que você escreve hoje.

Perguntas frequentes

Onde as habilidades Claude Code residem na minha máquina?

As habilidades Claude Code residem em dois locais: ~/.claude/skills/ para habilidades pessoais disponíveis em cada projeto e .claude/skills/ dentro de um repositório para habilidades no escopo do projeto comprometidas com o git. Cada habilidade é uma pasta que contém um arquivo SKILL.md com frontmatter YAML e instruções de redução. O chicote Claude Code os carrega automaticamente quando relevante.

O que diferencia uma super habilidade de uma habilidade Claude normal?

Uma super habilidade tem três propriedades que faltam a uma habilidade regular: memória indexada que pode ser recuperada entre sessões, a capacidade de obter as ferramentas e fontes de dados certas por tarefa e um ciclo de autoaperfeiçoamento que avalia seus próprios resultados e refina suas próprias instruções ao longo do tempo. Habilidades regulares são descontos estáticos que produzem o mesmo resultado no dia 1 e no dia 90.

Preciso do Pinecone ou posso usar o Obsidian como base de conhecimento?

Obsidian funciona bem para bases de conhecimento com aproximadamente 200 arquivos markdown longos. Além disso, o Pinecone serverless economiza custos significativos de token porque retorna pedaços classificados em vez de carregar arquivos inteiros. O Pinecone Starter é gratuito para pequenas cargas de trabalho; O padrão é $50/month para uso em produção. Para obter detalhes sobre a configuração do Pinecone, consulte meu gravação ilimitada de memória AI.

Quanto custa o Firecrawl para um fluxo de trabalho Claude Code pessoal?

Firecrawl Hobby custa $ 16/month por 3.000 créditos e é suficiente para um fluxo de trabalho pessoal com algumas habilidades diárias de pesquisa na web. O padrão é $ 83/month por 100.000 créditos. A raspagem padrão é de 1 crédito por página, a pesquisa é de 1 crédito por resultado, a extração JSON adiciona 4 créditos por página.

Qual é o componente de super habilidade mais importante a ser construído primeiro?

A habilidade de encerramento. Ele é executado no final de cada sessão, arquiva a conversa, extrai suas correções e atualiza o arquivo de perfil. Sem ele, nenhuma outra parte do Memory OS terá dados para trabalhar. Construa-o antes do Pinecone, Firecrawl ou do loop de refinamento.

Vamos trabalhar juntos

Procurando construir sistemas AI, automatizar fluxos de trabalho ou dimensionar sua infraestrutura tecnológica? Eu adoraria ajudar.

Fiverr (compilações e integrações personalizadas): fiverr.com/s/EgxYmWD
Portfólio: mejba.me
Ramlit Limited (soluções empresariais): ramlit.com
ColorPark (design e marca): colorpark.io
xCyberSecurity (serviços de segurança): xcybersecurity.io

Super Skills no Claude Code: meu build log real