La Filtración de 512K Líneas de Claude: Lo Que Anthropic No Quería Que Vieras
Una entrada faltante en .npmignore. Eso es todo. Eso fue lo único que separó los secretos más celosamente guardados de Anthropic de cualquier desarrollador con un comando npm install.
El 31 de marzo de 2026, a las 00:21 UTC, alguien del equipo de lanzamiento de Anthropic subió Claude Code v2.1.88 al registro de npm. Bun — el runtime de JavaScript que Anthropic adquirió a finales de 2025 — genera source maps por defecto. Nadie los excluyó del paquete. En tres horas, 512.000 líneas de TypeScript sin ofuscar distribuidas en aproximadamente 1.900 archivos fueron replicadas, bifurcadas y analizadas por decenas de miles de desarrolladores en todo el mundo. Una reescritura clean-room alcanzó 50.000 estrellas en GitHub en dos horas — probablemente el repositorio de más rápido crecimiento en la historia de GitHub.
Anthropic confirmó la autenticidad de la filtración sin negar un solo detalle. Y lo que revelaron esas 512.000 líneas no era solo infraestructura interna y flags de depuración. Era una visión completamente diferente de cómo se ve el desarrollo asistido por IA — una donde tu agente de codificación nunca duerme, sueña mientras estás ausente y opera en un nivel de capacidad tan peligroso que no puede liberarse al público.
He pasado los últimos cinco días leyendo cada análisis creíble, cruzando las referencias del código filtrado con las declaraciones confirmadas de Anthropic, y mapeando lo que esto significa para los desarrolladores que construyen con Claude todos los días. Esto es lo que encontré — y por qué algunas cosas me inquietaron genuinamente.
Cómo 512.000 Líneas Salieron por la Puerta Principal
La mecánica de esta filtración merece atención, porque revela algo importante sobre el estado de la infraestructura de IA en 2026.
Claude Code está construido sobre Bun, que compila TypeScript en JavaScript empaquetado para distribución. Práctica estándar. Pero Bun genera archivos .map de source maps por defecto — archivos detallados que mapean la salida compilada de vuelta al código fuente original. Cada nombre de variable, cada comentario interno, cada feature flag no publicado, preservado en total fidelidad.
La solución habría sido una sola línea en .npmignore:
*.map
O un campo files en package.json que explícitamente incluyera solo la salida compilada en la lista blanca. Cualquiera de los dos enfoques toma unos quince segundos de implementar. Ninguno se hizo.
Entre las 00:21 y las 03:29 UTC del 31 de marzo, cualquiera que instaló o actualizó Claude Code vía npm descargó un source map de 59,8 MB que contenía toda la base de código. The Hacker News reportó que apareció una versión troyanizada del cliente HTTP dentro de esa ventana — un troyano de acceso remoto multiplataforma aprovechándose del caos. Anthropic retiró el paquete, pero el código fuente ya estaba en todas partes.
Aquí está la parte que debería incomodar a todo líder de ingeniería: este es el segundo fallo de seguridad importante de Anthropic en una sola semana. Fortune reportó que solo días antes, un sistema de gestión de contenido mal configurado había filtrado un borrador de publicación de blog sobre un modelo no publicado llamado Mythos. Dos filtraciones. Una semana. De la empresa que construye la seguridad de IA como su identidad central.
No señalo esto para ensañarme. Lo señalo porque la ironía es instructiva. La empresa que construye los modelos de IA más conscientes de la seguridad en la industria fue derribada por .npmignore y una mala configuración de CMS. La seguridad de infraestructura no se trata de filosofía — se trata de listas de verificación. Y Anthropic falló la lista de verificación dos veces.
Pero, ¿qué reveló la filtración? Ahí es donde las cosas se ponen genuinamente fascinantes.
Los Nombres en Clave Internos: Fenck, Capra, Tangu y Numbat
Enterrados en el código fuente había nombres en clave internos para los niveles de modelos de Claude. Si has seguido las convenciones de nomenclatura de Anthropic, tres de estos eran esperados:
- Opus = Fenck
- Sonnet = Capra
- Haiku = Tangu
Estándar. Toda empresa de IA usa nombres en clave internos para desacoplar el branding del producto de las referencias de ingeniería. Lo que captó la atención de todos fue un cuarto nombre: Numbat. Aparece en la base de código sin modelo público correspondiente, sin documentación, sin material de marketing. Solo referencias en el código que confirman que existe.
El código fuente filtrado también contenía cadenas de versión para Opus 4.7 y Sonnet 4.8 — ninguno de los cuales ha sido anunciado. No estaban enterrados en archivos de prueba comentados. Aparecieron en lógica de validación de versiones y verificaciones de compatibilidad, sugiriendo que se están desarrollando y probando activamente de forma interna.
Los mercados de predicción reaccionaron rápido. Polymarket actualmente estima la probabilidad de que Claude 4.7 se lance antes del 30 de junio de 2026 en aproximadamente 59%. Dada la cadencia reciente de Anthropic — Opus 4.6 se lanzó el 5 de febrero, Sonnet 4.6 siguió el 17 de febrero — un lanzamiento a mediados de 2026 para la próxima generación no es especulación. Es la trayectoria esperada.
Pero Opus 4.7 y Sonnet 4.8 ni siquiera son el hallazgo más interesante. Ni de lejos.
Mythos y el Nivel Capybara: El Modelo Demasiado Peligroso Para Publicar
El borrador de publicación de blog que se filtró días antes del volcado del código fuente hacía referencia a algo que Anthropic llamó Claude Mythos, operando bajo un nuevo nivel llamado Capybara (referenciado internamente como "Capiara" en algunas rutas de código). Esto no es una actualización menor. Fortune obtuvo la descripción interna de Anthropic: un modelo que representa un "salto cualitativo" en capacidades, "más grande e inteligente que nuestros modelos Opus — que eran, hasta ahora, los más potentes."
Deja que eso cale. El lenguaje interno de Anthropic describe Capybara como un nivel por encima de Opus. No un reemplazo — una adición. Un cuarto nivel que se ubica en la cima de la pila de capacidades, diseñado para tareas computacionalmente intensivas que van más allá de lo que incluso Opus puede manejar.
Los números de benchmark de la documentación filtrada cuentan la historia:
| Benchmark | Claude Opus 4.6 | Claude Mythos (Capybara) | Mejora |
|---|---|---|---|
| S.E. Bench Verified | 80,8% | 87,4% | +6,6% |
| Terminal Bench 2.0 | 65,4% | 78,4% | +13,0% |
| GPQA Diamond | Mediados de los 80 (est.) | Salto significativo | — |
Esos números de Terminal Bench son asombrosos. Una mejora de 13 puntos porcentuales en un benchmark que mide la ejecución real de comandos de terminal y tareas de administración de sistemas. Para contextualizar, la brecha entre GPT-5.4 y Opus 4.6 en S.E. Bench es de menos de un punto porcentual (80,0% vs 80,8%). Mythos no cierra brechas — crea nuevas.
Se reporta que el modelo viene con una ventana de contexto nativa de 1 millón de tokens. No un complemento de contexto extendido añadido después. Nativo. Construido en la arquitectura desde la base.
Entonces, ¿por qué no habías oído hablar de él hasta ahora? Porque Anthropic no lo lanzará públicamente.
Según múltiples fuentes que analizan los materiales filtrados, Mythos demostró una capacidad que cruzó una línea con la que Anthropic no estaba cómodo: puede descubrir y explotar vulnerabilidades de software más rápido de lo que los equipos de seguridad humanos pueden parchearlas. Las capacidades de ciberseguridad del modelo eran tan avanzadas que Anthropic restringió el acceso a un puñado de clientes de ciberdefensa con acceso anticipado — organizaciones confiables para usar capacidades ofensivas de IA solo con fines defensivos.
Este es un momento crucial para la industria de la IA. Hemos pasado de "la IA podría ser peligrosa eventualmente" a "construimos algo tan capaz que no podemos lanzarlo." Anthropic tomó una decisión de negocio deliberada de dejar dinero sobre la mesa — potencialmente cantidades enormes — porque las implicaciones de seguridad del acceso generalizado a Mythos eran demasiado significativas.
Si confías en el juicio de Anthropic aquí depende de tus opiniones más amplias sobre la gobernanza de la IA. Pero el hecho de que una empresa con fines de lucro voluntariamente retuviera su producto más capaz te dice algo sobre lo que vieron durante las pruebas. Si ejecutas cualquier tipo de infraestructura de producción, esta es tu señal para tomar en serio tu postura de seguridad — porque las capacidades ofensivas que Mythos representa eventualmente se propagarán, ya sea de Anthropic o de un competidor con menos salvaguardas. Para una inmersión más profunda en las capacidades de seguridad de Claude en el modelo actual, consulta mi análisis sobre cómo funcionan en la práctica las mejoras de seguridad de Claude Code.
KAIROS: El Agente Que Nunca Duerme
La filtración del código fuente reveló algo que, para mí personalmente, fue más interesante que Mythos: una función no publicada llamada KAIROS.
El nombre proviene del griego antiguo — kairos significa "el momento oportuno," en oposición a chronos (tiempo secuencial). Es un nombre apropiado para lo que describe el código: un modo daemon autónomo donde Claude Code opera como un agente persistente en segundo plano.
Así es como funciona KAIROS basándose en la implementación filtrada:
1. El Sistema Heartbeat KAIROS funciona con un heartbeat basado en ticks, verificando a intervalos regulares si debe tomar acción. Piensa en él como un cron job, pero inteligente — no solo ejecuta según un horario, evalúa si la acción está justificada basándose en el estado actual del proyecto.
2. Presupuesto de Acción Proactiva El agente tiene una ventana de acción proactiva de 15 segundos por tick. Es una restricción deliberadamente ajustada. Tiempo suficiente para ejecutar una prueba, verificar una CI pipeline o escanear problemas — pero no suficiente para descontrolarse y reescribir tu base de código mientras vas por café.
3. Cambio de Modo Consciente del Contexto Cuando KAIROS detecta que el usuario ha cambiado de foco (cambió a otra ventana, quedó inactivo, se fue), activa el modo autónomo. Cuando el usuario regresa, vuelve al modo colaborativo — mostrando lo que hizo mientras estabas ausente y esperando tu input antes de tomar más acciones.
4. Herramientas Daemon Exclusivas
El código filtrado hace referencia a herramientas a las que solo KAIROS puede acceder: PushNotification (para alertarte cuando algo importante sucede), SubscribePR (para monitorear la actividad de pull requests), y varias otras diseñadas para operación en segundo plano.
Si has seguido mis escritos sobre la arquitectura de enjambre de agentes de Claude Code, KAIROS representa la evolución natural de ese patrón. La arquitectura de enjambre le dio a Claude la capacidad de coordinar múltiples sub-agentes en tareas complejas. KAIROS les da a esos agentes la capacidad de seguir trabajando cuando no estás mirando.
Imagina esto: estás trabajando en un feature branch. Haces push de tus cambios y cierras tu portátil para almorzar. Mientras estás fuera, KAIROS nota que la CI pipeline falló. Lee los logs de error, identifica un test inestable, investiga si el fallo está relacionado con tus cambios o era preexistente, y abre una PR con una corrección. Cuando vuelves, hay una notificación: "Corregido test inestable en auth_middleware_spec.rb — CI pasando en tu branch. ¿Quieres que haga merge?"
Eso no es un flujo de trabajo hipotético que estoy inventando. Eso es lo que describe la arquitectura del código filtrado. La infraestructura está construida. Las herramientas están definidas. La lógica de cambio de modo está implementada. Simplemente no se ha lanzado todavía.
Las implicaciones para desarrolladores independientes son enormes. KAIROS esencialmente te da un desarrollador junior que trabaja mientras duermes, no come nada y nunca se queja de que le asignen arreglar tests inestables. Para equipos, es un multiplicador de fuerza que maneja el trabajo de mantenimiento que nadie quiere hacer pero todos necesitan.
Autodream: Enseñarle a la IA a Dormir
Si KAIROS es el agente que nunca duerme, Autodream es el sistema que le enseña a soñar.
Cualquiera que haya trabajado con agentes de codificación de IA en sesiones largas conoce el problema: entropía de contexto. Cuanto más dura una sesión, más se degrada la comprensión del agente sobre tu proyecto. Comienza a olvidar decisiones tempranas. Contradice instrucciones de hace veinte minutos. La compactación — donde el agente resume su contexto para liberar tokens — pierde matices importantes. Para la hora dos, básicamente estás trabajando con un agente que tiene amnesia.
Autodream ataca este problema en su raíz. Cuando el usuario queda inactivo, Autodream genera un sub-agente bifurcado que ejecuta un proceso de consolidación de memoria. Los paralelos con el sueño humano son intencionales y sorprendentemente precisos:
Fusionar Observaciones Superpuestas Si el agente principal observó el mismo patrón en tres archivos diferentes durante la sesión, Autodream los consolida en una sola observación confiable. "El proyecto usa el patrón repositorio para todo acceso a base de datos" en lugar de tres notas separadas sobre archivos individuales.
Eliminar Contradicciones Las sesiones largas acumulan contexto contradictorio. Al principio de la sesión, el agente podría notar "este proyecto usa REST APIs." Más tarde, después de trabajar en un módulo diferente, podría observar "este proyecto usa GraphQL." Autodream resuelve esto: "El proyecto usa REST para APIs públicas y GraphQL para comunicación interna entre servicios."
Convertir Suposiciones Vagas en Hechos Firmes El contexto crudo de sesión está lleno de observaciones cautelosas: "Este archivo podría ser el punto de entrada" o "Este patrón parece que podría ser el middleware de autenticación." Autodream evalúa estas contra toda la base de código y las confirma como hechos o las descarta.
La implementación es arquitectónicamente elegante. El sub-agente de sueño recibe acceso bash de solo lectura — puede inspeccionar tu código pero nunca modificarlo. El acceso de escritura está limitado exclusivamente a archivos de memoria. Esto significa que Autodream puede consolidar y clarificar la comprensión del agente sobre tu proyecto sin ningún riesgo de modificar accidentalmente tu código fuente durante un proceso en segundo plano.
Si has leído mi artículo sobre construir sistemas de IA auto-mejorantes con Claude Code, Autodream es ese concepto llevado a su conclusión lógica. En lugar de que el desarrollador construya manualmente bucles de reflexión, el agente gestiona su propio mantenimiento de memoria. El sistema se mejora a sí mismo podando contexto malo y fortaleciendo contexto bueno — autónomamente, en segundo plano, mientras estás haciendo algo completamente diferente.
Esta es la función que más me emociona de toda la filtración. No porque sea la más llamativa — los benchmarks de Mythos son más impresionantes sobre el papel — sino porque la entropía de contexto es el mayor punto de dolor en mi flujo de trabajo diario asistido por IA. Un modelo que consolida su propia memoria durante el tiempo de inactividad resuelve un problema con el que lucho todos los días.
El Panorama de Modelos de IA en 2026: ¿Dónde Queda Cada Uno?
La filtración del código fuente de Claude no ocurrió de forma aislada. Cayó en un panorama de IA donde tres empresas están atrapadas en una carrera cada vez más reñida. Aquí está la situación a principios de abril de 2026:
| Modelo | S.E. Bench Verified | Fortaleza Principal | Ventana de Contexto |
|---|---|---|---|
| Claude Opus 4.6 | 80,8% | Trabajo de UI, decisiones arquitectónicas, comprensión estética | 200K (1M disponible) |
| GPT-5.4 | 80,0% | Entornos de terminal, DevOps, velocidad de ejecución bruta | 1M |
| Gemini 3.1 Pro | 80,6% | Mejor relación precio-rendimiento | 1M nativo |
| Claude Mythos (no publicado) | 87,4% | Todo — particularmente ciberseguridad | 1M nativo |
La brecha entre los tres principales modelos disponibles públicamente es mínima. Menos de un punto porcentual los separa en el benchmark de codificación más respetado. Esa no es una carrera donde un solo modelo "gana." Es una carrera donde la mejor estrategia es emparejar el modelo correcto con la tarea correcta.
GPT-5.4 sobresale en flujos de trabajo intensivos de terminal — DevOps, automatización de infraestructura, tareas de administración de sistemas donde la velocidad bruta de ejecución de comandos importa más que la estética del código. Cubrí esto extensamente en mi primera impresión de GPT-5.4.
Gemini 3.1 Pro ofrece la mejor propuesta de valor. Si tu cuello de botella son los costes de API en lugar de la capacidad bruta, el modelo de Google entrega 80,6% de rendimiento en S.E. Bench a una fracción de lo que cuesta Opus por token. Mi reseña de Gemini 3.1 Pro detalla los casos de uso específicos donde supera a modelos que cuestan el doble.
Opus 4.6 sigue siendo mi herramienta diaria para cualquier cosa que involucre generación de UI, decisiones arquitectónicas complejas, o tareas donde la salida necesita verse pulida y coherente. Su comprensión estética — la capacidad de generar código que produce resultados visualmente coherentes — sigue siendo inigualable. Mi reseña práctica de Opus 4.6 cubre esto en detalle.
Pero la tendencia que estoy observando no se trata de qué modelo es el "mejor." La tendencia es la orquestación de inteligencia — usar diferentes modelos para diferentes subtareas dentro del mismo proyecto, basándose en sus fortalezas específicas. La arquitectura daemon de KAIROS en el código filtrado realmente soporta este patrón. El agente en segundo plano podría teóricamente despachar diferentes niveles de modelos para diferentes tipos de tareas en segundo plano: Haiku para verificaciones rápidas de lint, Sonnet para análisis de tests, Opus para revisión arquitectónica.
Estamos pasando de "¿qué modelo de IA debería usar?" a "¿cómo compongo un sistema de IA a partir de múltiples modelos especializados?" Esa es una pregunta fundamentalmente diferente, y requiere un conjunto de habilidades fundamentalmente diferente.
Lo Que los Nombres en Clave Internos Nos Dicen Sobre la Hoja de Ruta de Anthropic
Déjame conectar algunos puntos que no he visto a nadie más exponer claramente.
El código filtrado hace referencia a cuatro nombres en clave de modelos: Fenck (Opus), Capra (Sonnet), Tangu (Haiku), y el misterioso Numbat. Más el nivel Capybara para Mythos. Son cinco identificadores internos para una empresa que actualmente envía tres niveles públicos.
Esto es lo que creo que está pasando.
Anthropic está reestructurando su oferta de modelos. El sistema actual de tres niveles (Haiku / Sonnet / Opus) fue diseñado cuando los modelos tenían niveles de capacidad claros. Pero a medida que la brecha de rendimiento entre niveles se estrecha — Sonnet 4.6 maneja tareas que requerían Opus 3.5 hace apenas un año — la lógica de niveles necesita evolucionar.
Capybara (Mythos) añade un techo sobre Opus para tareas computacionalmente intensivas y de alto riesgo. Numbat probablemente llena un vacío en algún lugar de la oferta actual — quizás un nivel entre Haiku y Sonnet optimizado para tareas de alto rendimiento y baja latencia donde Haiku es demasiado limitado pero Sonnet es excesivo. Piensa en cargas de trabajo intensivas de API donde haces miles de llamadas al modelo por minuto y necesitas calidad consistente sin los costes de nivel Sonnet.
Las cadenas de versión para Opus 4.7 y Sonnet 4.8 confirman que la cadencia de desarrollo de Anthropic es rápida. No se están durmiendo en los laureles del 4.6. Con una probabilidad del 59% en mercados de predicción de que 4.7 se lance antes de julio, la próxima generación probablemente está en la etapa final de pruebas ahora mismo.
Para desarrolladores que construyen sobre la API de Claude, esto significa que tu lógica de selección de modelos necesita ser flexible. Codificar en duro claude-opus-4-6-20260205 en tu aplicación te va a morder dentro de meses. Construye capas de abstracción. Usa alias de modelos. Diseña tus sistemas para intercambiar modelos sin reescribir código de integración.
¿Qué Deberían Hacer los Desarrolladores con Esta Información?
He pasado cinco días sumergido en esta historia. Esto es lo que estoy cambiando realmente en mi propio flujo de trabajo basándome en lo que he aprendido.
1. Prepárate para Agentes Autónomos — Llegan Más Rápido de Lo Esperado
KAIROS no es un prototipo de investigación. El código filtrado muestra una implementación de grado de producción con restricciones de seguridad, cambio de modo y permisos de herramientas. Cuando esto se lance — y se lanzará, probablemente en 2026 — el flujo de trabajo del desarrollador cambiará fundamentalmente. Empieza a pensar en qué partes de tu flujo de trabajo podrían beneficiarse de un agente en segundo plano: monitoreo de CI, triaje de revisión de código, análisis de actualización de dependencias, escaneo de seguridad.
Si prefieres que alguien construya estos flujos de trabajo de agentes autónomos desde cero, acepto proyectos de integración y automatización de IA. Puedes ver lo que he construido en fiverr.com/s/EgxYmWD.
2. Mejora Tu Postura de Seguridad — Ahora Mismo
Mythos puede encontrar vulnerabilidades más rápido de lo que los defensores humanos pueden parchearlas. Esa capacidad existe hoy, incluso si está restringida. Otros laboratorios están construyendo capacidades similares. Las herramientas ofensivas de IA se propagarán. Si tu aplicación tiene dependencias sin parchear, servidores mal configurados, o ese tipo de deuda de seguridad descuidada que "nadie tiene tiempo de arreglar," la ventana para arreglarlo discretamente se está cerrando.
Ejecuta npm audit en cada proyecto. Actualiza tus dependencias. Habilita escaneo de seguridad automatizado en tu CI pipeline. Esto ya no es opcional — son fundamentos de supervivencia.
3. Aprende Orquestación de Inteligencia
La era de elegir un modelo de IA y usarlo para todo está terminando. Los desarrolladores que prosperarán en 2026 y más allá son los que puedan componer sistemas a partir de múltiples modelos especializados. Empieza a experimentar con el enrutamiento de diferentes tipos de tareas a diferentes modelos. Usa Haiku para clasificación y triaje. Usa Sonnet para generación e iteración. Usa Opus para revisión y arquitectura. Construye la memoria muscular ahora mientras las herramientas aún están madurando.
4. Diseña para Persistencia de Memoria
Autodream revela la respuesta de Anthropic a la entropía de contexto — y es una buena respuesta. Pero incluso antes de que se lance, puedes diseñar tus flujos de trabajo alrededor del mismo principio. Usa archivos CLAUDE.md, bancos de memoria y resúmenes de sesión para darle a tu agente contexto persistente. Cuando Autodream se lance, mejorará lo que ya has construido. No estás esperando la función — estás construyendo los cimientos sobre los que se asentará.
5. Vigila a Numbat
Sea lo que sea Numbat, representa la apuesta de Anthropic por una brecha de capacidad en la oferta actual. Si es un nivel de alto rendimiento entre Haiku y Sonnet, podría cambiar drásticamente la economía de las aplicaciones intensivas en IA. Mantén un ojo en las notas de lanzamiento de Anthropic. Cuando Numbat aparezca, los adoptadores tempranos que ya tengan capas de abstracción de modelos podrán integrarlo inmediatamente.
El Panorama General: Lo Que la Peor Semana de Anthropic Revela Sobre el Mejor Futuro de la IA
Da un paso atrás de las funciones específicas y los números de benchmark. ¿Qué nos dice realmente esta filtración sobre hacia dónde se dirige el desarrollo de IA?
Tres cosas destacan.
La IA autónoma no es un estado futuro — es un problema de ingeniería que se está resolviendo ahora mismo. KAIROS y Autodream no son conceptuales. Están implementados. Las restricciones de seguridad están definidas. La lógica de cambio de modo funciona. La única brecha entre aquí y el despliegue es pruebas, refinamiento y la tolerancia al riesgo de Anthropic. La pregunta no es "¿funcionarán los agentes de IA de forma autónoma?" Es "¿cuándo se sentirán las empresas lo suficientemente seguras para lanzarlo?"
La tensión entre seguridad y capacidad es real y se está agudizando. Anthropic construyó un modelo que supera todo en el mercado por un amplio margen, luego lo encerró en una bóveda porque las implicaciones de ciberseguridad eran demasiado serias. Esa tensión — construir lo más capaz posible, y luego decidir si lanzarlo — va a definir los próximos dos años del desarrollo de IA. Cada laboratorio importante enfrenta el mismo dilema. Cómo lo resuelvan dará forma a la industria más que cualquier mejora de benchmark.
El foso no es la inteligencia del modelo — es el sistema alrededor del modelo. Los benchmarks de Mythos son impresionantes. Pero las funciones que cambiarían mi vida diaria no son sobre inteligencia bruta. Son sobre KAIROS ejecutando pruebas mientras duermo. Autodream consolidando la memoria de mi agente mientras almuerzo. PushNotification alertándome cuando mi agente en segundo plano encontró algo importante. El modelo es un componente. El sistema es el producto.
Ese último punto es al que sigo volviendo. Hemos estado tan enfocados en qué modelo puntúa más alto en qué benchmark que hemos perdido de vista la verdadera carrera. La verdadera carrera es quién construye el mejor sistema alrededor del modelo — el bucle autónomo, la persistencia de memoria, la orquestación inteligente.
Basándome en lo que vi en esas 512.000 líneas, Anthropic está más adelante en esa carrera de lo que esperaba. Mucho más adelante.
El error de .npmignore le costó a Anthropic su sorpresa competitiva. Pero para desarrolladores como tú y como yo, nos dio algo valioso: una vista clara del camino por delante. Y ese camino lleva a un lugar específico — hacia sistemas de IA que no solo responden cuando se les pregunta, sino que anticipan, actúan y mejoran mientras no estamos mirando.
La pregunta no es si estás listo para ese futuro. La pregunta es si estás construyendo hacia él ahora mismo — o si estarás luchando por ponerte al día cuando llegue.
Preguntas Frecuentes
¿Qué se filtró exactamente en el incidente del código fuente de Claude?
El 31 de marzo de 2026, se expusieron 512.000 líneas del código fuente TypeScript de Claude Code a través de source maps de npm debido a una entrada faltante en .npmignore. La filtración reveló nombres en clave internos de modelos, funciones no publicadas como KAIROS y Autodream, y referencias a próximas versiones de modelos incluyendo Opus 4.7 y Sonnet 4.8. Para el desglose completo de cada descubrimiento, consulta las secciones anteriores.
¿Qué es Claude Mythos y cuándo estará disponible?
Claude Mythos es el modelo ultra-nivel no publicado de Anthropic que opera bajo la clasificación de nivel "Capybara", con una puntuación de 87,4% en S.E. Bench Verified comparado con el 80,8% de Opus 4.6. Actualmente está restringido a clientes selectos de ciberdefensa debido a su capacidad para descubrir vulnerabilidades más rápido de lo que los equipos humanos pueden parchearlas. No se ha anunciado fecha de lanzamiento público.
¿Qué es KAIROS en Claude Code?
KAIROS es un modo daemon autónomo no publicado que permite a Claude Code operar como un agente persistente en segundo plano. Utiliza un sistema heartbeat con un presupuesto de acción proactiva de 15 segundos, cambia entre modos autónomo y colaborativo basándose en la presencia del usuario, e incluye herramientas exclusivas como PushNotification y SubscribePR para operaciones en segundo plano.
¿Cómo funciona Autodream en Claude Code?
Autodream es un sistema de consolidación de memoria en segundo plano que genera un sub-agente bifurcado durante los períodos de inactividad del usuario. Fusiona observaciones superpuestas, elimina contradicciones en el contexto de sesión y convierte suposiciones vagas en hechos confirmados — todo con acceso de solo lectura al código y acceso de escritura limitado exclusivamente a archivos de memoria.
¿Está confirmado Claude Opus 4.7?
Opus 4.7 y Sonnet 4.8 aparecieron en lógica de validación de versiones dentro del código fuente filtrado, confirmando desarrollo interno activo. Los mercados de predicción estiman aproximadamente un 59% de probabilidad de que Claude 4.7 se lance antes del 30 de junio de 2026, aunque Anthropic no ha hecho ningún anuncio oficial.
Trabajemos Juntos
¿Buscas construir sistemas de IA, automatizar flujos de trabajo o escalar tu infraestructura tecnológica? Me encantaría ayudar.
- Fiverr (desarrollos personalizados e integraciones): fiverr.com/s/EgxYmWD
- Portfolio: mejba.me
- Ramlit Limited (soluciones empresariales): ramlit.com
- ColorPark (diseño y marca): colorpark.io
- xCyberSecurity (servicios de seguridad): xcybersecurity.io