O Mythos da Anthropic testou o curl. O hype não sobreviveu

O Mythos da Anthropic testou o curl. O hype não sobreviveu.

Estava na metade do meu segundo café em 11 de maio quando a postagem do blog de Daniel Stenberg apareceu no meu feed. O título era "Mythos finds a curl vulnerability." Parecia bastante direto. Cliquei, comecei a ler e em dois parágrafos percebi que o post estava fazendo algo muito mais interessante do que o título sugeria.

Era uma desmontagem educada, metódica e gelada de um dos anúncios de IA mais agressivamente divulgados de 2026.

Para contextualizar, a Anthropic passou abril construindo uma das narrativas de segurança mais ruidosas do ano. Project Glasswing. Claude Mythos Preview. "Os dias dos zero-days estão contados." "Os defensores finalmente têm a chance de vencer de forma decisiva." Um compromisso de $100M em créditos de modelo. Listas de parceiros que pareciam um quem é quem do software crítico. Cobri o lançamento e o debate subjacente na minha análise da descoberta de zero-days com IA e no artigo sobre o impacto do Claude Mythos na cibersegurança. O enquadramento era inequívoco: a Anthropic havia construído algo tão capaz de encontrar falhas de software que não podia ser lançado ao público geral.

Depois, apontaram para o curl. A base de código C mais auditada da web aberta. Mantida por um cara que passou os últimos dezoito meses destruindo publicamente relatórios de segurança de IA por serem lixo.

O resultado? Mythos entregou cinco "vulnerabilidades de segurança confirmadas." A equipe de Stenberg confirmou uma. Um bug de baixa severidade. Corrigido no curl 8.21.0, previsto para o final de junho.

Esse é o dado que o comunicado de imprensa não incluiu. E é o que vale a pena assimilar — porque se você constrói software profissionalmente, executa agentes em produção ou se importa com onde a segurança assistida por IA realmente está agora (não onde a apresentação diz), o episódio do curl acabou de te dar uma leitura limpa e bem instrumentada da verdade.

Permita-me percorrer o que realmente aconteceu, o que isso significa e por que acredito que este único CVE de baixa severidade importa mais do que o comunicado de imprensa que o cercou.

O que a Anthropic realmente prometeu com o Mythos

Antes de chegarmos aos dados do curl, as alegações de marketing importam — porque a lacuna entre elas e o resultado é toda a história.

A Anthropic anunciou o Project Glasswing em 7 de abril de 2026. O título era Claude Mythos Preview, descrito como "um modelo de fronteira de propósito geral, não lançado" que havia alcançado "um nível de capacidade de codificação onde podem superar todos, exceto os humanos mais qualificados, em encontrar e explorar vulnerabilidades de software." Essas são as palavras da Anthropic, não as minhas.

A evidência de apoio era impressionante. Mythos havia supostamente identificado milhares de vulnerabilidades de alta severidade em principais sistemas operacionais e navegadores web. O caso de demonstração que recebeu mais cobertura: Mythos encontrou e explorou autonomamente uma falha de execução remota de código de 17 anos no FreeBSD que dava acesso root a qualquer máquina rodando NFS — classificada como CVE-2026-4747. A Anthropic também alegou uma taxa de sucesso de 83,1% no CyberGym, um benchmark que mede a descoberta autônoma de CVEs reais em bases de código reais. O melhor modelo anterior estava em 66,6%.

Até aqui, impressionante. Então vieram as alegações de marketing que fizeram cada pesquisador de segurança que eu sigo apertar os olhos para a tela.

"Os dias dos zero-days estão contados."

"Os defensores finalmente têm a chance de vencer de forma decisiva."

Esse é o enquadramento que a Anthropic escolheu. Não "esta é uma nova ferramenta útil." Não "a análise de código assistida por IA acabou de melhorar significativamente." Uma mudança categórica na ofensiva e defesa cibernética. Uma nova era. Uma arma tão poderosa que a Anthropic se recusou a lançá-la ao público geral — em vez disso, distribuindo acesso através do Project Glasswing a um pequeno grupo de parceiros, com a Linux Foundation como canal para alguns mantenedores de código aberto.

O posicionamento estratégico era limpo. Capacidade tão perigosa que não pode ser aberta. Capacidade tão necessária que deve ser implantada. Confiem em nós com os controles.

Estou neste campo há tempo suficiente para reconhecer quando uma empresa está fazendo um movimento genuíno de segurança versus quando está fazendo um movimento de posicionamento. Ambos podem ser verdade ao mesmo tempo. Mas o teste de qual domina é sempre o mesmo: o que acontece quando a capacidade encontra um benchmark sério no mundo real, diante de alguém que não pode ser bajulado.

Esse teste chegou em 6 de maio de 2026. O benchmark foi o curl. O alguém foi Daniel Stenberg.

Por que o curl é o teste perfeito (e o pior para o marketing)

Se você quisesse preparar o Mythos para falhar, apontaria para o curl. Se quisesse prepará-lo para ter sucesso honestamente, também apontaria para o curl. A mesma resposta nos dois casos — porque o curl é o ambiente de teste mais limpo possível para um scanner de vulnerabilidades de IA, e essa limpeza corta nos dois sentidos.

Eis o porquê.

O curl tem aproximadamente 178.000 linhas de C mantidas por uma comunidade de 573 contribuidores ao longo de mais de duas décadas. Roda em mais de 110 sistemas operacionais e 28 arquiteturas de CPU. Está instalado em mais de 20 bilhões de dispositivos — telefones, tablets, carros, televisores, consoles de jogos, servidores, sistemas embarcados que você nem sabe que existem. Se o seu software se comunica com a internet, o curl provavelmente está em algum lugar do seu stack.

Só isso já o torna um alvo de alto valor. Mas a parte que importa para esta conversa é a postura de segurança. O curl publicou 188 CVEs ao longo de sua vida, com aproximadamente ~50 novas vulnerabilidades esperadas para serem divulgadas em 2026. Isso não é sinal de que a base de código é desleixada. É sinal de que a base de código é examinada. Cada CVE representa uma vulnerabilidade que foi encontrada e corrigida antes de ser explorada, que é exatamente o ciclo que você quer de um projeto crítico para a segurança.

A infraestrutura defensiva dentro do curl é, por qualquer padrão razoável, de classe mundial. Buffers dinâmicos com limite. Aplicação explícita de valores máximos na análise numérica. Proteções contra overflow. Aplicação de formato de strings que elimina sistematicamente classes inteiras de bugs. Fuzzing contínuo. Análise estática. Cobertura de regressão automatizada. E — crucialmente para esta história — um extenso histórico de análise de segurança assistida por IA com ferramentas anteriores.

O próprio Stenberg tem sido notavelmente transparente sobre isso. Em sua postagem de blog de 22 de abril de 2026 "High-Quality Chaos," observou que os relatórios assistidos por IA finalmente haviam cruzado de ser majoritariamente lixo para ser significativamente úteis. Ele nomeou as ferramentas que estavam contribuindo com sinal real: AISLE, Zeropath e OpenAI Codex Security. Entre elas, essas ferramentas de IA de geração anterior haviam desencadeado entre duzentas e trezentas correções de bugs integradas ao curl nos 8-10 meses anteriores.

Leia essa frase novamente. Antes de o Mythos escanear o curl, ferramentas de IA de geração anterior já haviam impulsionado centenas de correções na base de código. Os bugs fáceis — o tipo que aparece com correspondência básica de padrões, o tipo que fuzzers encontram com algumas milhares de iterações, o tipo que qualquer "scanner de segurança de IA" pode detectar em uma demonstração — já tinham sido eliminados. O que restava era a camada difícil: bugs reais escondidos em caminhos de código sutis, edge cases profundos, pré-condições de múltiplos passos.

Essa é exatamente a superfície onde um modelo categoricamente melhor deveria superar o resto. Se o Mythos realmente representa uma mudança radical na pesquisa de vulnerabilidades — do tipo que justifica o enquadramento de "os dias dos zero-days estão contados" — o curl é precisamente onde você esperaria vê-lo provar isso.

Então, o que o teste produziu?

O relatório real do Mythos: cinco relatórios, um bug real

A postagem de blog de Stenberg percorre o relatório que ele recebeu. Vale notar: Stenberg nunca teve acesso direto ao Mythos. A Anthropic havia prometido acesso via Project Glasswing através da Linux Foundation. Esse acesso nunca se materializou. Em vez disso, alguém com credenciais do Mythos o executou contra o repositório do curl e enviou a saída por e-mail para Stenberg.

O relatório continha cinco descobertas, cada uma rotulada pelo Mythos como uma "vulnerabilidade de segurança confirmada."

A equipe de segurança de sete pessoas de Stenberg revisou todas. Aqui está o detalhamento do que sobreviveu ao contato com pessoas que realmente conhecem a base de código:

Descoberta	Veredicto do Mythos	Veredicto da equipe do curl
Problema 1	Vulnerabilidade confirmada	Vulnerabilidade de baixa severidade — CVE no 8.21.0
Problema 2	Vulnerabilidade confirmada	Falso positivo — comportamento documentado da API
Problema 3	Vulnerabilidade confirmada	Falso positivo — comportamento documentado da API
Problema 4	Vulnerabilidade confirmada	Falso positivo — comportamento documentado da API
Problema 5	Vulnerabilidade confirmada	Bug, mas não um problema de segurança

Uma de cinco. Uma taxa de verdadeiros positivos de 20% no rótulo mais importante que o Mythos aplicou. E a que sobreviveu está sendo corrigida como um CVE de baixa severidade no curl 8.21.0, programado para o final de junho.

Permita-me ser preciso sobre o que "baixa severidade" significa no framework CVSS do curl, porque a palavra pode soar mais suave do que deveria. Baixa severidade na escala do curl ainda significa um bug real, uma divulgação real, um ciclo real de patches e uma atualização coordenada real em bilhões de dispositivos. Não é nada. Também não é o tipo de descoberta que justifica a retórica de "os defensores finalmente têm a chance de vencer de forma decisiva."

Os resultados auxiliares são ligeiramente mais interessantes. Além das cinco "vulnerabilidades de segurança," o Mythos também sinalizou aproximadamente 20 bugs menores na base de código. A maioria deles se sustentou sob revisão. Não eram problemas de segurança, mas eram bugs reais — descobertas de qualidade de código que a equipe do curl começou a trabalhar. Isso é produção genuinamente útil. Também é exatamente o que um LLM competente de revisão de código tem sido capaz de produzir há pelo menos um ano, e o que ferramentas como AISLE e Zeropath já vêm entregando em escala.

A conclusão de Stenberg, em suas próprias palavras: "Minha conclusão pessoal não pode terminar em outra coisa senão que o grande hype em torno deste modelo até agora foi principalmente marketing." E: "Não vejo evidência de que esta configuração encontre problemas em um nível particularmente mais alto ou avançado do que as outras ferramentas fizeram antes do Mythos."

Isso não é uma alfinetada casual. É um mantenedor de código aberto de múltiplas décadas que gerencia um dos pipelines de segurança mais exigidos da internet, afirmando calmamente que o modelo de segurança de IA mais divulgado de 2026 não superou as ferramentas que já estavam disponíveis.

Se você está construindo com IA agora — agentes, automações, ferramentas de segurança, qualquer coisa — esse dado vale mais do que todo o comunicado de imprensa que o cercou. Permita-me explicar por quê.

O que isso nos diz sobre onde a segurança com IA realmente está

Quero percorrer o que acredito que o episódio do curl realmente prova, porque não é a leitura simples de "Mythos é um fracasso" que alguns comentaristas estão divulgando.

Três coisas são verdade ao mesmo tempo. Nenhuma delas é confortável para a posição maximalista nem para a minimalista.

Primeiro: Mythos é real, funciona e é significativamente capaz. Um modelo que escaneia uma base de código C de 178.000 linhas mantida por 573 contribuidores e encontra um CVE real mais 20 bugs menores em uma única passagem não é nada. É um resultado não trivial contra uma base de código que foi martelada por cada fuzzer, analisador estático e ferramenta de segurança de IA atualmente em produção. O sinal é real. A produção é útil.

Segundo: Mythos não é o salto categórico que o marketing alegou. A taxa de verdadeiros positivos de 20% em seu rótulo de maior confiança, combinada com o fato de que ferramentas de IA de geração anterior já estavam impulsionando centenas de correções de bugs através do curl, faz o enquadramento de "os dias dos zero-days estão contados" soar como texto publicitário em vez de realidade técnica. Mythos parece ser uma melhoria moderada sobre ferramentas já implantadas, não uma mudança de paradigma.

Terceiro: a lacuna entre (1) e (2) é o fato mais importante em toda a narrativa de segurança com IA de 2026. É a lacuna onde cada exagero, cada política de acesso restrito, cada ciclo de marketing de medo vive. E a lacuna está se fechando — mas não na direção que o marketing sugere. A realidade são ferramentas moderadamente úteis, usadas por humanos experientes, produzindo ganhos incrementais em segurança. O marketing continua insistindo na revolução.

Serei honesto. Esperava chegar a um lugar diferente quando comecei a escrever este artigo. A narrativa da Anthropic é internamente consistente. A demonstração do FreeBSD foi impressionante. Os números do CyberGym, tomados ao pé da letra, são impressionantes. Ao entrar na pesquisa, meio que esperava descobrir que Stenberg estava sendo duro demais, ou que o teste do curl era um cenário injusto, ou que a taxa de falsos positivos se suavizaria sob uma leitura mais atenta.

Não suavizou. Os números são o que são. Uma de cinco no rótulo de segurança. Vinte bugs menores com precisão aceitável. Zero descobertas avançadas que as ferramentas anteriores não detectaram. Contra a base de código C de código aberto mais extensamente pré-analisada do planeta, Mythos teve desempenho de uma versão moderadamente melhor do que já estava em produção.

Isso conecta diretamente com um framework ao qual continuo voltando: o problema de calibração entre hype e realidade na IA sobre o qual escrevi antes. Alegações de marketing viajam na velocidade da internet. Verificação viaja na velocidade humana. A janela entre o lançamento e a verificação é exatamente onde a narrativa é moldada — e quando a verificação chega, a narrativa original muitas vezes já foi precificada pelos mercados, pela imprensa e pela conversa de políticas públicas.

Esta não é uma posição anti-IA. Executo agentes de IA em produção diariamente. Aposto meu próprio tempo e dinheiro nessas ferramentas. Mas apostar bem requer calibração, e calibração requer observar o que acontece quando alegações de capacidade encontram o mundo real.

O teste do curl é o mundo real. A pontuação é um bug de baixa severidade.

A curva de maturidade: de lixo de IA a útil, em dois anos

Há um arco mais longo aqui que vale a pena ampliar, porque o episódio do curl não é um snapshot de um único quadro — é um quadro em uma sequência que começou há dois anos e continua evoluindo.

Veja a linha do tempo:

2 de janeiro de 2024. Daniel Stenberg publica "The I in LLM stands for Intelligence." Nele, descreve a inundação de relatórios de bugs gerados por IA de baixa qualidade chegando ao programa HackerOne do curl. Por meados de 2025, ele estimou que aproximadamente 20% das submissões ao programa de bug bounty do curl eram o que ele chamou de "lixo de IA" — relatórios que soavam técnicos mas não continham nada útil. A taxa de relatórios precisos caiu para aproximadamente um em cada 20 ou um em cada 30, e a triagem estava consumindo a largura de banda da equipe de segurança de sete pessoas.

26 de janeiro de 2026. O curl anunciou o encerramento do seu programa pago de bug bounty. A razão citada: o lixo gerado por IA havia feito a matemática de custo-benefício colapsar. Um programa de bounty projetado para recompensar divulgações úteis havia se tornado um ímã para submissões de baixo esforço e alto volume assistidas por IA. O curl não foi o único projeto afetado — o Nextcloud e vários outros tomaram medidas similares na mesma época. O ecossistema de segurança de código aberto estava sendo inundado por relatórios gerados por IA.

22 de abril de 2026. Stenberg publica "High-Quality Chaos." A mudança de tom é real. Ele observa que os relatórios assistidos por IA — quando executados por engenheiros experientes, não por submissores anônimos de bounty — agora estão entregando sinal genuíno. Ferramentas como AISLE, Zeropath e OpenAI Codex Security impulsionaram coletivamente centenas de correções no curl. A IA cruzou o limiar de ser um negativo líquido para um positivo líquido no ecossistema do curl.

6 de maio de 2026. O curl recebe o relatório do Mythos. Cinco descobertas. Uma sobrevive à revisão.

Final de junho de 2026 (planejado). O curl 8.21.0 é lançado com o patch para a única descoberta confirmada do Mythos.

Esse arco de dois anos é a história real. As ferramentas de segurança de IA começaram como um incômodo, tornaram-se modestamente úteis e agora estão melhorando incrementalmente — trimestre a trimestre, lançamento de modelo após lançamento de modelo, com cada geração ligeiramente mais ajustada que a anterior. Mythos é o último dado nessa curva, não uma descontinuidade em relação a ela.

Acredito que esse arco é o enquadramento mais importante para qualquer desenvolvedor tentando decidir onde colocar suas apostas agora. A curva de maturidade é real. Aponta em uma direção útil. Mas não é vertical. Nem é particularmente íngreme. É uma curva de capacidade normal, um pouco mais rápida que o habitual, em um campo que tem sido supervalorizado por pelo menos três anos.

Nota lateral — testei essa hipótese em minha própria infraestrutura no fim de semana passado. Executei uma revisão de segurança assistida por IA em uma base de código Laravel de médio porte que mantenho para um cliente. As descobertas foram úteis. Algumas já estavam no nosso backlog. Algumas eram genuinamente novas. Nenhuma justificou reescrever a estratégia de segurança. Essa experiência coincide exatamente com o que a equipe do curl está relatando. Ferramenta útil. Não uma revolução. Combine-a com humanos experientes e ela demonstra seu valor. Dê o volante e ela vai desperdiçar seu tempo.

O problema de equidade do Project Glasswing do qual ninguém quer falar

Há uma parte desta história que as análises técnicas continuam pulando, e quero dedicar algum tempo a ela porque acredito que é o problema mais consequente a longo prazo.

Mythos tem acesso restrito. O modelo não está disponível de forma geral. O acesso é controlado através do Project Glasswing, com uma lista curada de parceiros e a Linux Foundation servindo como canal para um pequeno conjunto de projetos de código aberto. O enquadramento da Anthropic é que o modelo é perigoso demais para ser lançado amplamente, então estão direcionando-o para uso defensivo com parceiros de confiança e comprometendo $100M em créditos de modelo para torná-lo economicamente viável para esses parceiros.

Tome esse enquadramento ao pé da letra por um momento. A consequência estrutural é a mesma independentemente da intenção: um pequeno número de organizações obtém acesso antecipado ao melhor modelo de detecção de vulnerabilidades disponível, e o resto do mundo não.

Agora adicione dois fatos.

Fato um: Stenberg, o mantenedor de uma das peças mais críticas de infraestrutura de código aberto para a segurança na internet, recebeu a promessa de acesso ao Mythos via Glasswing e nunca o obteve. Ele teve que esperar outra pessoa executar o modelo e enviar o relatório por e-mail. Se o curl é pequeno demais para passar na barreira de acesso, o que isso diz sobre a longa cauda de projetos de código aberto menos famosos? Os 90% das dependências abaixo da sua aplicação que não têm um mantenedor com um nome reconhecível?

Fato dois: a própria avaliação interna da Anthropic, vazada no vazamento do documento Claude Mythos no início deste ano, descrevia o modelo como inclinando o equilíbrio ofensivo-defensivo a favor da ofensiva. Palavras deles, não minhas. O modelo é um multiplicador de força para quem o detém. Restringir o acesso por confiança e curadoria significa que defensores com acesso obtêm o multiplicador; defensores sem acesso, não.

Onde isso aterrissa na prática: organizações bem financiadas com os relacionamentos certos obtêm proteção. Todos os outros devem esperar que o modelo de nível público chegue antes que um atacante com capacidade comparável o faça. Essa não é uma preocupação hipotética — é o mesmo problema de assimetria de acesso que tem sido uma característica da indústria de cibersegurança por décadas, exceto que agora a assimetria se assenta na camada do modelo em vez da camada de ferramentas.

Não estou argumentando que a Anthropic tomou a decisão errada. O problema de uso dual é real. Um Mythos amplamente lançado absolutamente acabaria nas mãos de atacantes, e o caso de segurança para implantação em etapas tem mérito. Mas há um custo real nessa abordagem, e o custo é suportado desproporcionalmente pelos atores menores no ecossistema de segurança — os mantenedores, os pesquisadores de segurança independentes, os projetos de código aberto que não têm o peso institucional para entrar em uma lista de parceiros do Glasswing.

Se o enquadramento de marketing fosse honesto, reconheceria esse custo. "Os dias dos zero-days estão contados" se tornaria "os dias dos zero-days estão contados para nossos parceiros; o resto de vocês ainda precisa resolver por conta própria." Esse é um título menos impressionante. Também está mais perto do que realmente está acontecendo.

O que isso significa para como você usa IA no seu próprio trabalho de segurança

Permita-me trazer isso de volta à questão prática, porque se você está lendo isso, provavelmente tem ferramentas de IA em algum lugar do seu stack de segurança — ou está considerando. O episódio do curl tem algumas implicações específicas para como usar essas ferramentas bem.

Este é o framework com o qual estou trabalhando agora, baseado no que os dados do curl nos dizem.

Use a IA como multiplicador de força do engenheiro experiente, não como substituto. A equipe do curl obteve produção útil do Mythos porque tinha uma equipe de segurança de sete pessoas que podia filtrar cinco descobertas até uma verdade. Sem essa camada de triagem, as cinco descobertas teriam sido tratadas como reais (desperdiçando esforço posterior) ou todas cinco teriam sido descartadas (perdendo o único bug real). A camada de triagem é o valor. IA sem revisão especializada é lixo. Revisão especializada sem IA é mais lenta do que precisa ser. Juntas, são o estado da arte atual.

Espere uma taxa de verdadeiros positivos de 15-25% em problemas de segurança sinalizados por qualquer ferramenta de IA atual. Isso é aproximadamente onde o Mythos aterrisou contra o curl, e é consistente com o que tenho visto de scanners de segurança estilo Codex em trabalho com clientes. Planeje seu pipeline de revisão em torno dessa proporção. Se sua equipe não pode se dar ao luxo de triar quatro falsos positivos para cada descoberta real, as ferramentas de segurança de IA vão custar mais tempo do que economizam.

Trate os rótulos de severidade de ferramentas de IA como sugestões, não como classificações. Mythos rotulou todas as cinco descobertas do curl como vulnerabilidades de segurança confirmadas. A atribuição real de severidade da equipe do curl para a única descoberta verdadeira foi baixa. Isso é uma degradação de múltiplos passos — de "vulnerabilidade de segurança" para "bug de baixa severidade." Severidade é um julgamento que depende do modelo de ameaça, superfície de ataque e condições de exploração. Ferramentas de IA atualmente não fazem esse julgamento bem. Elas sinalizam padrões. Humanos avaliam risco.

Não pague pelo nível empresarial com versão bloqueada a menos que possa verificar o ganho. O resultado do Mythos contra o curl, comparado com os resultados de AISLE e Zeropath nos meses anteriores, sugere que a lacuna entre modelos de segurança de fronteira e a geração anterior é mais estreita do que o marketing implica. Antes de assinar um contrato de seis dígitos por ferramentas de segurança de IA de "nível fronteira," execute uma avaliação paralela contra as alternativas mais baratas em uma fatia representativa do seu próprio código. Os números do curl sugerem que a diferença pode não justificar o preço.

Preste atenção à descoberta de bugs, não apenas à descoberta de vulnerabilidades. O resultado mais forte do Mythos no curl foram os ~20 bugs menores não relacionados à segurança que ele encontrou. Esses têm valor real — a qualidade do código melhora, a superfície futura de bugs diminui, a manutenção fica mais fácil. Se você enquadra ferramentas de segurança de IA puramente como um encontrador de CVEs, vai subvalorizá-las. Se as enquadra como uma ferramenta de "qualidade de código e redução de risco," a matemática do retorno sobre investimento fica melhor.

Este framework não é novo. É o que engenheiros de segurança experientes vêm dizendo sobre ferramentas de IA nos últimos 18 meses. O episódio do curl simplesmente tornou mais difícil desconsiderar esses engenheiros como desatualizados.

A única previsão em que tenho confiança

Quero encerrar com uma previsão, porque acredito que a trajetória importa mais do que o snapshot.

O episódio Mythos+curl será lembrado como o momento em que a narrativa de segurança com IA de 2026 se recalibrou. Não porque Mythos fracassou — não fracassou — mas porque a lacuna entre as alegações de marketing e a produção verificada se tornou impossível de ignorar quando a verificação veio de um mantenedor com uma plataforma pública e zero incentivos para bajular o fornecedor.

O que acontece em seguida, eu apostaria, é uma segunda onda mais silenciosa e honesta de alegações de segurança com IA. Os fornecedores vão diminuir a retórica de "os dias dos zero-days estão contados." O enquadramento vai se deslocar para linguagem de "multiplicador de força," arquiteturas "humano-no-loop" e "redução incremental de risco" — a proposta de valor real. A direção de pesquisa verdadeiramente inovadora — ferramentas de segurança agênticas autônomas que podem encontrar, validar e corrigir vulnerabilidades de ponta a ponta — continuará avançando, mas a um ritmo que parece crescimento normal de capacidade, não o salto descontínuo como o Project Glasswing foi embalado.

As vulnerabilidades continuarão vindo. O curl continuará publicando CVEs aproximadamente na sua taxa atual. O pipeline de pesquisadores humanos continuará sendo a fonte dominante de descobertas de alto impacto por pelo menos os próximos vários trimestres. Ferramentas de IA continuarão demonstrando seu valor nas margens, melhorando ano após ano, e ocasionalmente encontrando algo genuinamente surpreendente. Principalmente, farão o que começaram a fazer: detectar o rotineiro mais rápido para que humanos possam se concentrar no difícil.

Essa é a versão entediante da história. Também é a verdadeira.

Se você quer a versão sem glamour do futuro da segurança com IA, aqui está em uma frase: ferramentas melhores usadas por engenheiros experientes continuarão superando ferramentas piores usadas por engenheiros inexperientes, e a lacuna entre os dois vai se ampliar, não se reduzir. O episódio Mythos+curl é um dado a serviço dessa tese. O marketing eventualmente alcançará a realidade. Sempre alcança. Mas enquanto isso, a aposta calibrada é assumir que suas ferramentas de segurança de IA são moderadamente melhores do que as do ano passado — e manter os humanos experientes firmemente no loop.

Daniel Stenberg já descobriu isso. A versão 8.21.0 do curl será lançada no final de junho com um CVE de baixa severidade corrigido, cortesia de um scan de IA que prometeu cinco vulnerabilidades e entregou uma. O bug será corrigido. A base de código ficará ligeiramente mais forte. O marketing seguirá para a próxima alegação.

E em algum lugar no próximo sprint, um engenheiro competente vai usar uma ferramenta de IA para encontrar um bug real na sua própria base de código, corrigir antes de ir para produção e voltar ao trabalho. Esse é o futuro. Já está aqui. Simplesmente não soa tão bem em um comunicado de imprensa.

Perguntas frequentes

O que o Mythos da Anthropic realmente encontrou no curl?

Mythos reportou cinco "vulnerabilidades de segurança confirmadas" no curl, mas apenas uma sobreviveu à revisão da equipe de segurança do curl. A única descoberta confirmada é um bug de baixa severidade que será corrigido no curl 8.21.0, programado para o final de junho de 2026. Três das descobertas rejeitadas eram falsos positivos sinalizando comportamento documentado da API, e uma era um bug sem implicações de segurança. Mythos também encontrou aproximadamente 20 bugs menores não relacionados à segurança com boa precisão.

Por que Daniel Stenberg chamou o Mythos de manobra de marketing?

Stenberg, o mantenedor principal do curl, concluiu que "o grande hype em torno deste modelo até agora foi principalmente marketing" porque Mythos não superou ferramentas de IA anteriores como AISLE, Zeropath ou OpenAI Codex Security — todas as quais já haviam impulsionado centenas de correções de bugs através do curl nos 8-10 meses anteriores. A taxa de verdadeiros positivos de 20% no rótulo de maior confiança do Mythos foi o sinal decisivo.

O que é o Project Glasswing da Anthropic?

Project Glasswing é o programa de acesso restrito da Anthropic para distribuir o Claude Mythos Preview a parceiros de segurança selecionados, com a Linux Foundation atuando como canal para alguns projetos de código aberto. A Anthropic comprometeu $100M em créditos de modelo para o programa. Stenberg recebeu a promessa de acesso mas nunca recebeu acesso direto — outra pessoa com credenciais do Glasswing executou o Mythos contra o curl e lhe enviou o relatório por e-mail.

Devo usar IA para análise de segurança nos meus próprios projetos?

Sim, com o enquadramento apropriado. As ferramentas de segurança de IA atuais — incluindo Mythos — funcionam como multiplicadores de força para engenheiros experientes, não como substitutos. Espere uma taxa de verdadeiros positivos de 15-25% em problemas de segurança sinalizados, planeje uma camada de triagem adequadamente e não terceirize a classificação de severidade para o modelo. Consulte o framework completo de implementação na seção "O que isso significa" acima.

Quando o Mythos estará disponível para o público?

A Anthropic não anunciou um lançamento público. O modelo está atualmente restrito aos parceiros do Project Glasswing sob um programa de acesso gerenciado, citando preocupações sobre capacidade ofensiva de uso dual. Não há um cronograma publicado para disponibilidade mais ampla, e com base no enquadramento da Anthropic do modelo como um ativo defensivo de software crítico, um lançamento amplo parece improvável no curto prazo.

Vamos trabalhar juntos

Procurando construir sistemas de IA, automatizar fluxos de trabalho ou escalar sua infraestrutura tecnológica? Adoraria ajudar.

Fiverr (desenvolvimentos personalizados e integrações): fiverr.com/s/EgxYmWD
Portfólio: mejba.me
Ramlit Limited (soluções empresariais): ramlit.com
ColorPark (design e branding): colorpark.io
xCyberSecurity (serviços de segurança): xcybersecurity.io

O Mythos da Anthropic testou o curl. O hype não sobreviveu