El Mythos de Anthropic atacó curl. El bombo no sobrevivió

El Mythos de Anthropic atacó curl. El bombo no sobrevivió.

Estaba a mitad de mi segundo café el 11 de mayo cuando la publicación del blog de Daniel Stenberg apareció en mi feed. El título era "Mythos finds a curl vulnerability." Sonaba bastante directo. Hice clic, empecé a leer y en dos párrafos me di cuenta de que el artículo estaba haciendo algo mucho más interesante de lo que sugería su título.

Era un desmontaje educado, metódico y gélido de uno de los anuncios de IA más agresivamente publicitados de 2026.

Para contextualizar, Anthropic dedicó abril a construir una de las narrativas de seguridad más ruidosas del año. Project Glasswing. Claude Mythos Preview. "Los días de los zero-days están contados." "Los defensores finalmente tienen la oportunidad de ganar de manera decisiva." Un compromiso de $100M en créditos de modelo. Listas de socios que parecían un quién es quién del software crítico. Cubrí el lanzamiento y el debate subyacente en mi análisis del descubrimiento de zero-days con IA y el artículo sobre el impacto de Claude Mythos en la ciberseguridad. El encuadre era inequívoco: Anthropic había construido algo tan capaz de encontrar fallos de software que no podía ser publicado al público general.

Luego lo apuntaron a curl. La base de código C más auditada de la web abierta. Mantenida por un tipo que ha pasado los últimos dieciocho meses destruyendo públicamente informes de seguridad de IA por ser basura.

¿El resultado? Mythos entregó cinco "vulnerabilidades de seguridad confirmadas." El equipo de Stenberg confirmó una. Un error de baja severidad. Parcheado en curl 8.21.0, previsto para finales de junio.

Ese es el dato que el comunicado de prensa no incluyó. Y es el que vale la pena asimilar — porque si construyes software profesionalmente, ejecutas agentes en producción o te importa dónde está realmente la seguridad asistida por IA ahora mismo (no donde dice la presentación), el episodio de curl acaba de darte una lectura limpia y bien instrumentada de la verdad.

Permíteme recorrer lo que realmente pasó, lo que significa y por qué creo que este único CVE de baja severidad importa más que el comunicado de prensa que lo rodeó.

Lo que Anthropic realmente prometió con Mythos

Antes de llegar a los datos de curl, las afirmaciones de marketing importan — porque la brecha entre ellas y el resultado es toda la historia.

Anthropic anunció Project Glasswing el 7 de abril de 2026. El titular era Claude Mythos Preview, descrito como "un modelo frontera de propósito general, no publicado" que había alcanzado "un nivel de capacidad de codificación donde pueden superar a todos excepto a los humanos más cualificados en encontrar y explotar vulnerabilidades de software." Esas son las palabras de Anthropic, no las mías.

La evidencia de respaldo era impactante. Mythos había identificado supuestamente miles de vulnerabilidades de alta severidad en los principales sistemas operativos y navegadores web. El caso de demostración que recibió más cobertura: Mythos encontró y explotó autónomamente una falla de ejecución remota de código de 17 años en FreeBSD que daba acceso root a cualquier máquina ejecutando NFS — clasificada como CVE-2026-4747. Anthropic también afirmó una tasa de éxito del 83.1% en CyberGym, un benchmark que mide el descubrimiento autónomo de CVEs reales en bases de código reales. El mejor modelo anterior estaba en el 66.6%.

Hasta aquí, impresionante. Luego llegaron las afirmaciones de marketing que hicieron a cada investigador de seguridad que sigo entrecerrar los ojos ante su pantalla.

"Los días de los zero-days están contados."

"Los defensores finalmente tienen la oportunidad de ganar de manera decisiva."

Ese es el encuadre que eligió Anthropic. No "esta es una herramienta nueva y útil." No "el análisis de código asistido por IA acaba de mejorar significativamente." Un cambio categórico en la ofensiva y defensa cibernética. Una nueva era. Un arma tan poderosa que Anthropic se negó a lanzarla al público general — en su lugar distribuyendo acceso a través de Project Glasswing a un pequeño grupo de socios, con la Linux Foundation como conducto para algunos mantenedores de código abierto.

El posicionamiento estratégico era limpio. Capacidad tan peligrosa que no puede ser abierta. Capacidad tan necesaria que debe ser desplegada. Confíen en nosotros con los controles.

He estado en esto lo suficiente como para reconocer cuándo una empresa está haciendo un movimiento genuino de seguridad versus cuándo están haciendo un movimiento de posicionamiento. Ambos pueden ser ciertos al mismo tiempo. Pero la prueba de cuál domina siempre es la misma: qué pasa cuando la capacidad se encuentra con un benchmark serio en el mundo real, frente a alguien que no puede ser adulado.

Esa prueba llegó el 6 de mayo de 2026. El benchmark fue curl. El alguien fue Daniel Stenberg.

Por qué curl es la prueba perfecta (y la peor para el marketing)

Si quisieras preparar a Mythos para fracasar, lo apuntarías a curl. Si quisieras prepararlo para tener éxito honestamente, también lo apuntarías a curl. La misma respuesta en ambos casos — porque curl es el entorno de prueba más limpio posible para un escáner de vulnerabilidades de IA, y esa limpieza corta en ambas direcciones.

Este es el por qué.

Curl tiene aproximadamente 178,000 líneas de C mantenidas por una comunidad de 573 contribuidores durante más de dos décadas. Se ejecuta en más de 110 sistemas operativos y 28 arquitecturas de CPU. Está instalado en más de 20 mil millones de dispositivos — teléfonos, tabletas, coches, televisores, consolas de videojuegos, servidores, sistemas embebidos que ni siquiera sabes que existen. Si tu software se comunica con internet, probablemente curl está en algún lugar de tu stack.

Eso por sí solo lo convierte en un objetivo de alto valor. Pero la parte que importa para esta conversación es la postura de seguridad. Curl ha publicado 188 CVEs a lo largo de su vida, con unas ~50 nuevas vulnerabilidades esperadas para ser divulgadas en 2026. Eso no es señal de que la base de código sea descuidada. Es señal de que la base de código es examinada. Cada CVE representa una vulnerabilidad que fue encontrada y corregida antes de ser explotada, que es exactamente el ciclo que quieres de un proyecto crítico para la seguridad.

La infraestructura defensiva dentro de curl es, por cualquier estándar razonable, de clase mundial. Buffers dinámicos con límite. Aplicación explícita de valores máximos en el análisis numérico. Guardias contra desbordamiento. Aplicación de formato de cadenas que elimina sistemáticamente clases enteras de bugs. Fuzzing continuo. Análisis estático. Cobertura de regresión automatizada. Y — crucialmente para esta historia — un extenso historial de análisis de seguridad asistido por IA con herramientas anteriores.

El propio Stenberg ha sido notablemente transparente al respecto. En su publicación de blog del 22 de abril de 2026 "High-Quality Chaos," señaló que los informes asistidos por IA finalmente habían cruzado de ser mayormente basura a ser significativamente útiles. Nombró las herramientas que habían estado contribuyendo señal real: AISLE, Zeropath y OpenAI Codex Security. Entre ellas, esas herramientas de IA de generación anterior habían desencadenado entre doscientas y trescientas correcciones de bugs integradas en curl durante los 8-10 meses anteriores.

Lee esa frase otra vez. Antes de que Mythos escaneara curl, las herramientas de IA de generación anterior ya habían impulsado cientos de correcciones en la base de código. Los bugs fáciles — el tipo que aparece con coincidencia de patrones básica, el tipo que los fuzzers encuentran con unos miles de iteraciones, el tipo que cualquier "escáner de seguridad de IA" puede detectar en una demostración — ya se habían ido. Lo que quedaba era la capa difícil: bugs reales ocultos en rutas de código sutiles, casos extremos profundos, precondiciones de múltiples pasos.

Esa es exactamente la superficie donde un modelo categóricamente mejor debería superar al resto. Si Mythos realmente representa un cambio radical en la investigación de vulnerabilidades — del tipo que justifica el encuadre de "los días de los zero-days están contados" — curl es precisamente donde esperarías verlo demostrarlo.

¿Entonces qué produjo la prueba?

El informe real de Mythos: cinco informes, un bug real

La publicación de blog de Stenberg recorre el informe que recibió. Vale la pena señalar: Stenberg nunca tuvo acceso directo a Mythos. Anthropic le había prometido acceso a través de Project Glasswing mediante la Linux Foundation. Ese acceso nunca se materializó. En su lugar, alguien más con credenciales de Mythos lo ejecutó contra el repositorio de curl y le envió el resultado por correo electrónico.

El informe contenía cinco hallazgos, cada uno etiquetado por Mythos como una "vulnerabilidad de seguridad confirmada."

El equipo de seguridad de siete personas de Stenberg los revisó todos. Este es el desglose de lo que sobrevivió al contacto con personas que realmente conocen la base de código:

Hallazgo	Veredicto de Mythos	Veredicto del equipo de curl
Problema 1	Vulnerabilidad confirmada	Vulnerabilidad de baja severidad — CVE en 8.21.0
Problema 2	Vulnerabilidad confirmada	Falso positivo — comportamiento documentado de la API
Problema 3	Vulnerabilidad confirmada	Falso positivo — comportamiento documentado de la API
Problema 4	Vulnerabilidad confirmada	Falso positivo — comportamiento documentado de la API
Problema 5	Vulnerabilidad confirmada	Bug, pero no un problema de seguridad

Una de cinco. Una tasa de verdaderos positivos del 20% en la etiqueta más importante que aplicó Mythos. Y la que sobrevivió está siendo parcheada como un CVE de baja severidad en curl 8.21.0, programado para finales de junio.

Permíteme ser preciso sobre lo que "baja severidad" significa en el marco CVSS de curl, porque la palabra puede sonar más suave de lo que debería. Baja severidad a la escala de curl sigue significando un bug real, una divulgación real, un ciclo real de parches y una actualización coordinada real en miles de millones de dispositivos. No es nada. Tampoco es el tipo de hallazgo que justifica la retórica de "los defensores finalmente tienen la oportunidad de ganar de manera decisiva."

Los resultados auxiliares son ligeramente más interesantes. Más allá de las cinco "vulnerabilidades de seguridad," Mythos también señaló aproximadamente 20 bugs menores en la base de código. La mayoría de estos se sostuvieron bajo revisión. No eran problemas de seguridad, pero eran bugs reales — hallazgos de calidad de código que el equipo de curl ha comenzado a trabajar. Eso es producción genuinamente útil. También es exactamente lo que un LLM competente de revisión de código ha sido capaz de producir durante al menos un año, y lo que herramientas como AISLE y Zeropath ya han estado entregando a escala.

La conclusión de Stenberg, en sus propias palabras: "Mi conclusión personal no puede terminar en otra cosa que no sea que el gran bombo alrededor de este modelo hasta ahora fue principalmente marketing." Y: "No veo evidencia de que esta configuración encuentre problemas a un nivel particularmente más alto o avanzado que las otras herramientas habían hecho antes de Mythos."

Eso no es un golpe casual. Es un mantenedor de código abierto de múltiples décadas que gestiona uno de los pipelines de seguridad más exigidos de internet, afirmando con calma que el modelo de seguridad de IA más publicitado de 2026 no superó a las herramientas que ya estaban disponibles.

Si estás construyendo con IA ahora mismo — agentes, automatizaciones, herramientas de seguridad, lo que sea — ese dato vale más que todo el comunicado de prensa que lo rodeó. Permíteme explicar por qué.

Lo que esto nos dice sobre dónde está realmente la seguridad con IA

Quiero recorrer lo que creo que el episodio de curl realmente demuestra, porque no es la lectura simple de "Mythos es un fracaso" que algunos comentaristas están difundiendo.

Tres cosas son ciertas al mismo tiempo. Ninguna de ellas es cómoda para la posición maximalista ni para la minimalista.

Primero: Mythos es real, funciona y es significativamente capaz. Un modelo que escanea una base de código C de 178,000 líneas mantenida por 573 contribuidores y encuentra un CVE real más 20 bugs menores en una sola pasada no es nada. Es un resultado no trivial contra una base de código que ha sido golpeada por cada fuzzer, analizador estático y herramienta de seguridad de IA actualmente en producción. La señal es real. La producción es útil.

Segundo: Mythos no es el salto categórico que el marketing afirmó. La tasa de verdaderos positivos del 20% en su etiqueta de mayor confianza, combinada con el hecho de que herramientas de IA de generación anterior ya estaban impulsando cientos de correcciones de bugs a través de curl, hace que el encuadre de "los días de los zero-days están contados" suene más a texto publicitario que a realidad técnica. Mythos parece ser una mejora moderada sobre las herramientas ya desplegadas, no un cambio de paradigma.

Tercero: la brecha entre (1) y (2) es el hecho más importante en toda la narrativa de seguridad con IA de 2026. Es la brecha donde vive cada exageración, cada política de acceso restringido, cada ciclo de marketing de miedo. Y la brecha se está cerrando — pero no en la dirección que sugiere el marketing. La realidad son herramientas moderadamente útiles, utilizadas por humanos experimentados, produciendo ganancias incrementales en seguridad. El marketing sigue insistiendo en la revolución.

Seré honesto. Esperaba llegar a un lugar diferente cuando empecé a escribir este artículo. La narrativa de Anthropic es internamente consistente. La demostración de FreeBSD fue impactante. Los números de CyberGym, tomados al pie de la letra, son impresionantes. Al entrar en la investigación, medio esperaba encontrar que Stenberg estaba siendo demasiado duro, o que la prueba de curl era un escenario injusto, o que la tasa de falsos positivos se suavizaría bajo una lectura más cercana.

No fue así. Los números son lo que son. Una de cinco en la etiqueta de seguridad. Veinte bugs menores con precisión aceptable. Cero hallazgos avanzados que las herramientas anteriores no detectaron. Contra la base de código C de código abierto más extensamente preanalizada del planeta, Mythos rindió como una versión moderadamente mejor de lo que ya estaba en producción.

Esto conecta directamente con un marco al que sigo volviendo: el problema de calibración entre bombo y realidad en la IA sobre el que he escrito antes. Las afirmaciones de marketing viajan a la velocidad de internet. La verificación viaja a la velocidad humana. La ventana entre el lanzamiento y la verificación es exactamente donde se moldea la narrativa — y para cuando llega la verificación, la narrativa original a menudo ya ha sido incorporada por los mercados, la prensa y la conversación de políticas públicas.

Esta no es una posición anti-IA. Ejecuto agentes de IA en producción diariamente. Apuesto mi propio tiempo y dinero a estas herramientas. Pero apostar bien requiere calibración, y la calibración requiere observar lo que sucede cuando las afirmaciones de capacidad se encuentran con el mundo real.

La prueba de curl es el mundo real. La puntuación es un bug de baja severidad.

La curva de madurez: de basura de IA a útil, en dos años

Hay un arco más largo aquí que vale la pena ampliar, porque el episodio de curl no es una instantánea de un solo fotograma — es un fotograma en una secuencia que comenzó hace dos años y sigue evolucionando.

Revisa la línea temporal:

2 de enero de 2024. Daniel Stenberg publica "The I in LLM stands for Intelligence." En él, describe la inundación de informes de bugs generados por IA de baja calidad que llegaban al programa HackerOne de curl. Para mediados de 2025, estimó que aproximadamente el 20% de las presentaciones al programa de recompensas por bugs de curl eran lo que él llamó "basura de IA" — informes que sonaban técnicos pero no contenían nada útil. La tasa de informes precisos cayó a aproximadamente uno de cada 20 o uno de cada 30, y el triaje estaba agotando el ancho de banda del equipo de seguridad de siete personas.

26 de enero de 2026. Curl anunció la terminación de su programa de recompensas por bugs pagado. La razón citada: la basura generada por IA había hecho colapsar las matemáticas de costo-beneficio. Un programa de recompensas diseñado para premiar divulgaciones útiles se había convertido en un imán para presentaciones de bajo esfuerzo y alto volumen asistidas por IA. Curl no fue el único proyecto afectado — Nextcloud y varios otros tomaron pasos similares por la misma época. El ecosistema de seguridad de código abierto estaba siendo inundado por informes generados por IA.

22 de abril de 2026. Stenberg publica "High-Quality Chaos." El cambio de tono es real. Señala que los informes asistidos por IA — cuando son ejecutados por ingenieros experimentados, no por remitentes anónimos de recompensas — ahora están entregando señal genuina. Herramientas como AISLE, Zeropath y OpenAI Codex Security han impulsado colectivamente cientos de correcciones en curl. La IA ha cruzado el umbral de ser un neto negativo a un neto positivo en el ecosistema de curl.

6 de mayo de 2026. Curl recibe el informe de Mythos. Cinco hallazgos. Uno sobrevive la revisión.

Finales de junio de 2026 (planificado). Curl 8.21.0 se publica con el parche para el único hallazgo confirmado de Mythos.

Ese arco de dos años es la historia real. Las herramientas de seguridad de IA comenzaron como una molestia, se volvieron modestamente útiles y ahora están mejorando incrementalmente — trimestre a trimestre, lanzamiento de modelo tras lanzamiento de modelo, con cada generación ligeramente más ajustada que la anterior. Mythos es el último dato en esa curva, no una discontinuidad respecto a ella.

Creo que ese arco es el encuadre más importante para cualquier desarrollador que intente decidir dónde colocar sus apuestas ahora mismo. La curva de madurez es real. Apunta en una dirección útil. Pero no es vertical. Ni siquiera es particularmente empinada. Es una curva de capacidad normal, algo más rápida de lo habitual, en un campo que ha sido sobrevendido durante al menos tres años.

Nota al margen — probé esta hipótesis en mi propia infraestructura el fin de semana pasado. Ejecuté una revisión de seguridad asistida por IA en una base de código Laravel de tamaño medio que mantengo para un cliente. Los hallazgos fueron útiles. Algunos ya estaban en nuestro backlog. Un par eran genuinamente nuevos. Ninguno de ellos justificó reescribir la estrategia de seguridad. Esa experiencia coincide exactamente con lo que reporta el equipo de curl. Herramienta útil. No una revolución. Combínala con humanos experimentados y demuestra su valor. Dale el volante y te hará perder el tiempo.

El problema de equidad de Project Glasswing del que nadie quiere hablar

Hay una parte de esta historia que los análisis técnicos siguen pasando por alto, y quiero dedicarle tiempo porque creo que es el problema más consecuente a largo plazo.

Mythos tiene acceso restringido. El modelo no está disponible de forma general. El acceso está controlado a través de Project Glasswing, con una lista curada de socios y la Linux Foundation sirviendo como conducto para un pequeño conjunto de proyectos de código abierto. El encuadre de Anthropic es que el modelo es demasiado peligroso para publicarse ampliamente, así que lo están dirigiendo hacia uso defensivo con socios de confianza y comprometiendo $100M en créditos de modelo para hacerlo económicamente viable para esos socios.

Toma ese encuadre al pie de la letra por un momento. La consecuencia estructural es la misma independientemente de la intención: un pequeño número de organizaciones obtiene acceso temprano al mejor modelo de detección de vulnerabilidades disponible, y el resto del mundo no.

Ahora añade dos hechos.

Hecho uno: Stenberg, el mantenedor de una de las piezas más críticas de infraestructura de código abierto para la seguridad en internet, recibió la promesa de acceso a Mythos a través de Glasswing y nunca lo obtuvo. Tuvo que esperar a que otra persona ejecutara el modelo y le enviara el informe por correo electrónico. Si curl es demasiado pequeño para superar la barrera de acceso, ¿qué dice eso sobre la larga cola de proyectos de código abierto menos famosos? ¿El 90% de las dependencias que están debajo de tu aplicación y que no tienen un mantenedor con un nombre reconocible?

Hecho dos: la propia evaluación interna de Anthropic, filtrada en la filtración del documento de Claude Mythos a principios de este año, describía el modelo como inclinando el equilibrio ofensivo-defensivo a favor de la ofensiva. Sus palabras, no las mías. El modelo es un multiplicador de fuerza para quien lo tenga. Restringir el acceso por confianza y curación significa que los defensores con acceso obtienen el multiplicador; los defensores sin acceso, no.

Donde esto aterriza en la práctica: las organizaciones bien financiadas con las relaciones correctas obtienen protección. Todos los demás deben esperar que el modelo de nivel público llegue antes de que un atacante con capacidad comparable lo haga. Esa no es una preocupación hipotética — es el mismo problema de asimetría de acceso que ha sido una característica de la industria de ciberseguridad durante décadas, excepto que ahora la asimetría se asienta en la capa del modelo en lugar de la capa de herramientas.

No estoy argumentando que Anthropic tomó la decisión equivocada. El problema de uso dual es real. Un Mythos publicado ampliamente absolutamente terminaría en manos de atacantes, y el caso de seguridad para un despliegue por etapas tiene mérito. Pero hay un costo real en ese enfoque, y el costo lo asumen desproporcionadamente los actores más pequeños del ecosistema de seguridad — los mantenedores, los investigadores de seguridad independientes, los proyectos de código abierto que no tienen el peso institucional para entrar en una lista de socios de Glasswing.

Si el encuadre de marketing fuera honesto, reconocería este costo. "Los días de los zero-days están contados" se convertiría en "los días de los zero-days están contados para nuestros socios; el resto de ustedes aún necesita resolverlo." Ese es un titular menos impresionante. También está más cerca de lo que realmente está sucediendo.

Lo que esto significa para cómo usas la IA en tu propio trabajo de seguridad

Permíteme llevar esto de vuelta a la pregunta práctica, porque si estás leyendo esto, probablemente tienes herramientas de IA en algún lugar de tu stack de seguridad — o lo estás considerando. El episodio de curl tiene algunas implicaciones específicas para cómo usar esas herramientas bien.

Este es el marco con el que estoy trabajando ahora, basado en lo que nos dicen los datos de curl.

Usa la IA como multiplicador de fuerza del ingeniero experimentado, no como reemplazo. El equipo de curl obtuvo producción útil de Mythos porque tenían un equipo de seguridad de siete personas que podía filtrar cinco hallazgos hasta una verdad. Sin esa capa de triaje, los cinco hallazgos habrían sido tratados como reales (desperdiciando esfuerzo posterior) o los cinco habrían sido descartados (perdiendo el único bug real). La capa de triaje es el valor. IA sin revisión experta es basura. Revisión experta sin IA es más lenta de lo necesario. Juntas, son el estado actual del arte.

Espera una tasa de verdaderos positivos del 15-25% en problemas de seguridad señalados por cualquier herramienta de IA actual. Eso es aproximadamente donde aterrizó Mythos contra curl, y es consistente con lo que he visto de escáneres de seguridad estilo Codex en trabajo con clientes. Planifica tu pipeline de revisión alrededor de esa proporción. Si tu equipo no puede permitirse filtrar cuatro falsos positivos por cada hallazgo real, las herramientas de seguridad de IA te costarán más tiempo del que ahorran.

Trata las etiquetas de severidad de las herramientas de IA como sugerencias, no como clasificaciones. Mythos etiquetó los cinco hallazgos de curl como vulnerabilidades de seguridad confirmadas. La asignación real de severidad del equipo de curl para el único hallazgo verdadero fue baja. Eso es una degradación de múltiples pasos — de "vulnerabilidad de seguridad" a "bug de baja severidad." La severidad es un juicio que depende del modelo de amenazas, la superficie de ataque y las condiciones de explotación. Las herramientas de IA actualmente no pueden hacer ese juicio bien. Señalan patrones. Los humanos evalúan el riesgo.

No pagues por el nivel empresarial con versión bloqueada a menos que puedas verificar la ganancia. El resultado de Mythos contra curl, comparado con los resultados de AISLE y Zeropath en los meses anteriores, sugiere que la brecha entre los modelos de seguridad frontera y la generación anterior es más estrecha de lo que el marketing implica. Antes de firmar un contrato de seis cifras por herramientas de seguridad de IA de "nivel frontera," ejecuta una evaluación paralela contra las alternativas más baratas en una porción representativa de tu propio código. Los números de curl sugieren que la diferencia puede no justificar el precio.

Presta atención al descubrimiento de bugs, no solo al descubrimiento de vulnerabilidades. El resultado más fuerte de Mythos en curl fueron los ~20 bugs menores no relacionados con seguridad que encontró. Esos tienen valor real — la calidad del código mejora, la superficie futura de bugs se reduce, el mantenimiento se facilita. Si encuadras las herramientas de seguridad de IA puramente como un buscador de CVEs, las infravalorarás. Si las encuadras como una herramienta de "calidad de código y reducción de riesgos," las matemáticas del retorno de inversión se ven mejor.

Este marco no es novedoso. Es lo que los ingenieros de seguridad experimentados han estado diciendo sobre las herramientas de IA durante los últimos 18 meses. El episodio de curl simplemente hizo más difícil desestimar a esos ingenieros como desactualizados.

La única predicción en la que tengo confianza

Quiero cerrar con una predicción, porque creo que la trayectoria importa más que la instantánea.

El episodio Mythos+curl será recordado como el momento en que la narrativa de seguridad con IA de 2026 se recalibró. No porque Mythos haya fracasado — no lo hizo — sino porque la brecha entre las afirmaciones de marketing y la producción verificada se volvió imposible de ignorar cuando la verificación vino de un mantenedor con una plataforma pública y cero incentivos para adular al proveedor.

Lo que sucede después, apostaría, es una segunda ola más silenciosa y honesta de afirmaciones de seguridad con IA. Los proveedores bajarán la retórica de "los días de los zero-days están contados." El encuadre se desplazará hacia lenguaje de "multiplicador de fuerza," arquitecturas "humano-en-el-bucle" y "reducción incremental del riesgo" — la propuesta de valor real. La dirección de investigación verdaderamente novedosa — herramientas de seguridad agénticas autónomas que pueden encontrar, validar y parchear vulnerabilidades de principio a fin — seguirá avanzando, pero a un ritmo que parece crecimiento normal de capacidades, no el salto discontinuo como el que Project Glasswing fue empaquetado.

Las vulnerabilidades seguirán viniendo. Curl seguirá publicando CVEs aproximadamente a su tasa actual. El pipeline de investigadores humanos seguirá siendo la fuente dominante de hallazgos de alto impacto durante al menos los próximos varios trimestres. Las herramientas de IA seguirán demostrando su valor en los márgenes, mejorando año tras año, y ocasionalmente encontrando algo genuinamente sorprendente. Principalmente, harán lo que han comenzado a hacer: detectar lo rutinario más rápido para que los humanos puedan concentrarse en lo difícil.

Esa es la versión aburrida de la historia. También resulta ser la verdadera.

Si quieres la versión sin glamour del futuro de la seguridad con IA, aquí está en una oración: mejores herramientas usadas por ingenieros experimentados seguirán superando a peores herramientas usadas por ingenieros sin experiencia, y la brecha entre ambos se ampliará, no se reducirá. El episodio Mythos+curl es un dato al servicio de esa tesis. El marketing eventualmente alcanzará a la realidad. Siempre lo hace. Pero mientras tanto, la apuesta calibrada es asumir que tus herramientas de seguridad de IA son moderadamente mejores que las del año pasado — y mantener a los humanos experimentados firmemente en el circuito.

Daniel Stenberg ya lo descubrió. La versión 8.21.0 de curl se publicará a finales de junio con un CVE de baja severidad parcheado, cortesía de un escaneo de IA que prometió cinco vulnerabilidades y entregó una. El bug será corregido. La base de código será ligeramente más fuerte. El marketing pasará a la siguiente afirmación.

Y en algún lugar del próximo sprint, un ingeniero competente va a usar una herramienta de IA para encontrar un bug real en su propia base de código, corregirlo antes de que se publique y volver al trabajo. Ese es el futuro. Ya está aquí. Simplemente no suena tan bien en un comunicado de prensa.

Preguntas frecuentes

¿Qué encontró realmente el Mythos de Anthropic en curl?

Mythos reportó cinco "vulnerabilidades de seguridad confirmadas" en curl, pero solo una sobrevivió la revisión del equipo de seguridad de curl. El único hallazgo confirmado es un bug de baja severidad que será parcheado en curl 8.21.0, programado para finales de junio de 2026. Tres de los hallazgos rechazados eran falsos positivos que señalaban comportamiento documentado de la API, y uno era un bug sin implicaciones de seguridad. Mythos también encontró aproximadamente 20 bugs menores no relacionados con seguridad con buena precisión.

¿Por qué Daniel Stenberg llamó a Mythos una maniobra de marketing?

Stenberg, el mantenedor principal de curl, concluyó que "el gran bombo alrededor de este modelo hasta ahora fue principalmente marketing" porque Mythos no superó a herramientas de IA anteriores como AISLE, Zeropath u OpenAI Codex Security — todas las cuales ya habían impulsado cientos de correcciones de bugs a través de curl durante los 8-10 meses anteriores. La tasa de verdaderos positivos del 20% en la etiqueta de mayor confianza de Mythos fue la señal decisiva.

¿Qué es el Project Glasswing de Anthropic?

Project Glasswing es el programa de acceso restringido de Anthropic para distribuir Claude Mythos Preview a socios de seguridad seleccionados, con la Linux Foundation actuando como conducto para algunos proyectos de código abierto. Anthropic comprometió $100M en créditos de modelo para el programa. Stenberg recibió la promesa de acceso pero nunca recibió acceso directo — otra persona con credenciales de Glasswing ejecutó Mythos contra curl y le envió el informe por correo electrónico.

¿Debería usar IA para análisis de seguridad en mis propios proyectos?

Sí, con el encuadre apropiado. Las herramientas de seguridad de IA actuales — incluyendo Mythos — funcionan como multiplicadores de fuerza para ingenieros experimentados, no como reemplazos. Espera una tasa de verdaderos positivos del 15-25% en problemas de seguridad señalados, planifica una capa de triaje en consecuencia y no externalices la clasificación de severidad al modelo. Consulta el marco completo de implementación en la sección "Lo que esto significa" más arriba.

¿Cuándo estará Mythos disponible para el público?

Anthropic no ha anunciado un lanzamiento público. El modelo está actualmente restringido a los socios de Project Glasswing bajo un programa de acceso gestionado, citando preocupaciones sobre la capacidad ofensiva de uso dual. No hay un cronograma publicado para una disponibilidad más amplia, y basándose en el encuadre de Anthropic del modelo como un activo defensivo de software crítico, un lanzamiento amplio parece improbable a corto plazo.

Trabajemos juntos

¿Buscas construir sistemas de IA, automatizar flujos de trabajo o escalar tu infraestructura tecnológica? Me encantaría ayudar.

Fiverr (desarrollos personalizados e integraciones): fiverr.com/s/EgxYmWD
Portafolio: mejba.me
Ramlit Limited (soluciones empresariales): ramlit.com
ColorPark (diseño y branding): colorpark.io
xCyberSecurity (servicios de seguridad): xcybersecurity.io

El Mythos de Anthropic atacó curl. El bombo no sobrevivió