AI Weekly: El declive de Claude, Muse Spark y Netflix VOID

Abrí mi terminal el lunes por la mañana y Claude me pidió confirmar una edición en un archivo que no había leído. No era un archivo que hubiera leído alguna vez. Era un archivo que no había abierto en absoluto. Iba a hacer pattern-matching con el nombre del archivo, adivinar los imports y proponer un cambio en un código que nunca había visto.

Cancelé la acción. Me quedé mirando la pantalla un segundo. Entonces recordé el informe de AMD que salió la semana anterior — ese en el que el equipo de Stella Laurenzo en AMD analizó 6,852 sesiones de Claude Code y descubrió que el “reads per edit” de Claude se había desplomado de 6.6 a 2.0. Una caída del 70% en la cantidad de contexto que Claude recopila antes de empezar a modificar tu código.

Llevaba semanas notándolo. Por fin los datos le pusieron nombre.

Esa fue la historia que dominó AI Twitter esta semana, pero no fue la única. Meta lanzó Muse Spark — su primer modelo del nuevo Superintelligence Labs. Netflix, de forma discreta, liberó como open source un modelo de video que entiende física. Anthropic firmó un acuerdo de cómputo de 3.5 gigavatios con Google y Broadcom que los analistas ahora estiman en $42 mil millones solo para 2027. Microsoft Word empezó a integrar Claude directamente en el panel de documentos. Y Andrej Karpathy publicó, casi sin darle importancia, una solución open source al problema de memoria de Claude que utiliza Obsidian como capa de almacenamiento.

Trece anuncios. Una semana. Aquí tienes mi análisis personal de lo que probé, lo que me sorprendió y lo que realmente importa para quienes construyen cosas.

La historia del rendimiento de Claude de la que todos susurraban

Déjame empezar por la que más me tocó de cerca.

Si usas Claude Code a diario, probablemente hayas sentido lo que estoy a punto de describir. Ediciones que se envían antes de leer. Planes que antes abarcaban seis archivos ahora se limitan a dos. El modelo toma la acción más barata disponible en lugar de la correcta. Yo le echaba la culpa a mis prompts. Le echaba la culpa a mis archivos de contexto. Me echaba la culpa a mí mismo.

Entonces llegaron las pruebas.

Stella Laurenzo, jefa del equipo de IA de AMD, publicó un análisis de datos de 6,852 sesiones de Claude Code que contenían 234,760 llamadas a herramientas y 17,871 bloques de pensamiento. Las cifras son contundentes. Entre el 30 de enero y el 12 de febrero —el periodo “bueno”—, Claude leía 6.6 archivos por cada archivo que editaba. Entre el 8 y el 23 de marzo, ese número se desplomó a 2.0. La profundidad de pensamiento cayó un 67% en el mismo intervalo.

El patrón de comportamiento que describe Laurenzo coincide exactamente con mi experiencia: Claude pasó de “investigar primero” a “editar primero”. Cuando el pensamiento se vuelve superficial, el modelo recurre por defecto a la acción más barata. Edita sin leer. Se detiene sin terminar. Elige la solución más simple en vez de la correcta. Esquiva la responsabilidad de los fallos que él mismo provocó.

La respuesta de Anthropic señaló dos cambios conocidos: Opus 4.6 pasó a pensamiento adaptativo por defecto el 9 de febrero, y el 3 de marzo el esfuerzo predeterminado bajó de alto a medio. Dicen que el encabezado redact-thinking-2026-02-12 es solo un cambio de interfaz. Los usuarios no se creen esa explicación completa —Fortune cubrió la reacción negativa en un artículo esta semana centrado en la “falta de transparencia” de Anthropic sobre actualizaciones silenciosas del modelo.

Aquí está la parte que importa para los desarrolladores: puedes luchar contra esto.

Lo que me está funcionando ahora mismo:

Establecer explícitamente thinking_effort: high en cada sesión de Claude Code que toque código de producción
Cargar el contexto manualmente —pegar los archivos relevantes en la conversación en vez de esperar que Claude los encuentre
Usar definiciones de agente más estrictas. Las instrucciones genéricas como “lee la base de código” generan lecturas superficiales. Instrucciones específicas como “lee estos cuatro archivos y luego compáralos con el comportamiento objetivo” siguen funcionando
Para cualquier tema arquitectónico, cambiar a Opus 4.6 con pensamiento extendido y aceptar el coste de tokens

Voy a detallar la configuración completa que uso en una publicación dedicada. Pero la versión corta: la confianza en los valores predeterminados silenciosos se acabó. Cada sesión seria necesita un presupuesto de pensamiento explícito y contexto explícito. La era de las sesiones de Claude Code “dispara y olvida” acaba de terminar.

Meta Muse Spark: El modelo multiagente que se esconde en tu WhatsApp

El 8 de abril, Meta lanzó Muse Spark, el primer modelo de Superintelligence Labs de Alexandr Wang desde que Meta gastó 14.000 millones de dólares para ficharlo.

Lo probé esa misma noche.

La función principal: Muse Spark puede lanzar múltiples subagentes especializados en paralelo para gestionar diferentes partes de una sola solicitud. Si le pides que planifique un viaje, activa simultáneamente un agente de vuelos, uno de hoteles y uno de actividades, y luego consolida los resultados. Además, incluye lo que Meta denomina una "cadena visual de pensamiento": razonamiento paso a paso sobre imágenes, mostrado explícitamente en la salida.

En el Intelligence Index, Muse Spark obtuvo una puntuación de 52. Esto lo sitúa por detrás de Gemini 3.1 Pro y GPT-5.4 (ambos con 57) y justo por debajo de Claude Opus 4.6 (53). No lidera en razonamiento general. Pero Meta realmente no apunta a ese terreno.

Donde Muse Spark realmente destaca es en tareas multimodales y relacionadas con la salud. Lo sometí a una prueba de interpretación de imágenes médicas y a un flujo de trabajo de planificación nutricional. En ambos casos, estuvo a la altura de Claude Opus 4.6, y en un caso concreto (interpretar una foto de un plato de comida y elaborar un desglose de macronutrientes), fue notablemente mejor. La cadena visual de pensamiento hizo que su razonamiento fuera legible de una manera que las respuestas visuales de Claude normalmente no logran.

Sin embargo, la verdadera jugada está en la distribución. Muse Spark se está desplegando dentro de WhatsApp, Instagram, Facebook, Messenger y las gafas de IA de Meta. Ese alcance ni Claude, ni ChatGPT, ni Gemini juntos lo tienen. Mi madre usa WhatsApp. Jamás ha abierto Claude.me en su vida. En seis meses, tendrá una IA multiagente integrada por defecto en su app de mensajería.

Una nota honesta: Muse Spark es propietario. Meta dijo que "esperan liberar versiones futuras como open-source". Dado cómo quemaron la confianza open-source con el retraso de los pesos de Llama 4, lo creeré cuando los pesos estén disponibles.

Netflix VOID: Edición de video que finalmente respeta la física

Esto sí que me sorprendió de verdad.

El equipo de investigación en IA de Netflix —en colaboración con INSAIT de la Universidad de Sofía— liberó como open source un modelo llamado VOID (Video Object and Interaction Deletion). Sobre el papel, es una herramienta para eliminar objetos de videos. En la práctica, es el primer modelo que he probado que realmente entiende lo que sucede en una escena cuando un objeto desaparece.

Si eliminas a una persona sosteniendo una guitarra de un video, la mayoría de las herramientas dejan la guitarra flotando en el aire o alucinan un borrón borroso donde estaba la persona. VOID elimina a la persona y la influencia física que ejercía sobre la guitarra: la guitarra cae. Si una mano presiona una almohada y la eliminas, la almohada recupera su forma original. Si borras un trompo girando, el polvo a su alrededor se asienta correctamente.

El enfoque técnico es ingenioso. VOID está construido sobre CogVideoX y utiliza una quadmask de 4 valores (0, 63, 127, 255) que codifica no solo qué eliminar, sino también qué regiones circundantes de la escena se ven afectadas físicamente. Ejecuta una inferencia en dos pasadas: la primera se encarga de la eliminación principal, la segunda corrige los artefactos de deformación de objetos que afectan a todos los modelos de difusión de video que he probado. Los datos de entrenamiento provienen de simulaciones físicas en Blender y del framework Kubric de Google: datos sintéticos emparejados con física real como referencia.

Supera a ProPainter, DiffuEraser, Runway, MiniMax-Remover y Gen-Omnimatte en benchmarks tanto reales como sintéticos. Y —esto todavía me cuesta creerlo— está disponible en Hugging Face y GitHub bajo licencia Apache 2.0.

Netflix acaba de regalar la herramienta que permite a pequeños estudios hacer ediciones en postproducción que antes requerían volver a grabar. Si trabajas en producción de video, herramientas para creadores o pipelines de datos sintéticos, este es el lanzamiento del trimestre.

Claude dentro de Microsoft Word: La beta que cambia el trabajo legal

Hay una beta en despliegue que no esperaba que me importara — hasta que la probé con un contrato real.

Microsoft ha integrado Claude dentro de Word. Abres un documento, invocas a Claude en el panel lateral, y puede resumir, analizar y editar el documento con cambios controlados. Pero la función específica que realmente importa: identifica automáticamente los cambios críticos y los puntos negociables en documentos legales y contractuales.

Le pasé un borrador de acuerdo de servicios que había estado posponiendo. En menos de un minuto, Claude había resaltado tres cláusulas que no eran estándar, explicó por qué cada una era inusual y propuso un lenguaje alternativo con cambios controlados que podía aceptar o rechazar. Fue como tener a un abogado junior haciendo la primera revisión — salvo que realmente leyó cada palabra.

Word tiene 1.200 millones de usuarios mensuales. Ahora Claude vive dentro de él. Esto no es solo el lanzamiento de una función de IA. Es un cambio de distribución.

Para cualquiera que trabaje con contratos, propuestas o documentos largos en Word — esta beta vale la espera.

Lanzamientos más discretos de Google: Notebooks, Managed Agents, Simulaciones, Compras con IA

Google lanzó cuatro novedades esta semana. Ninguna acaparó titulares. Juntas, marcan una tendencia.

Notebooks dentro de la app de Gemini te permiten organizar chats por proyecto con archivos fuente adjuntos. Piensa en NotebookLM, pero integrado en tus conversaciones habituales de Gemini. Migré mi flujo de trabajo de investigación de contenidos y eliminó casi por completo la fricción de “¿dónde guardé ese hilo de investigación?”.

Managed Agents es la respuesta de Google al SDK de agentes de Claude: agentes autónomos potenciados por Gemini que ejecutan tareas en segundo plano. Si viste mi recorrido por los Managed Agents de Anthropic, esta es la oferta paralela. Es temprano aún, pero la integración con Google Workspace significa que estos agentes pueden interactuar de forma nativa con Gmail, Calendar y Drive. Esa huella hoy Claude no la puede igualar.

Simulaciones Interactivas es la sorpresa silenciosa. Gemini Pro ahora puede generar simulaciones físicas en vivo y en ejecución: lo probé con el clásico ejemplo del doble péndulo y construyó una simulación funcional que pude parametrizar en tiempo real. Esto va a devorar una parte del espacio de contenidos educativos en menos de 12 meses.

Compras con IA para India lanzó comparaciones de productos en lenguaje natural usando Gemini + Lens. Los lanzamientos regionales están convirtiéndose en el patrón de Google: prueban flujos de compra complejos en mercados donde Amazon es menos dominante antes de llevarlos a Occidente.

Ninguna de estas novedades es “la noticia de la semana” por sí sola. Juntas, Google acaba de sumar cuatro nuevas superficies de distribución para Gemini en siete días.

La historia de Ghost Murmur: Donde tuve que detenerme y comprobar

Quiero señalar este caso porque es el tipo de historia que suena a hype de IA hasta que investigas — y entonces suena a algo distinto.

El 3 de abril, un piloto estadounidense fue rescatado en Irán. Circularon informes de que su ubicación fue determinada usando una herramienta de IA clasificada llamada "Ghost Murmur", descrita como capaz de detectar firmas electromagnéticas individuales de latidos cardíacos a millas de distancia. Al parecer, el piloto fue localizado sin activos tradicionales de vigilancia.

Físicos en quienes confío rechazaron rotundamente la historia. El campo electromagnético generado por un latido humano es medible en laboratorio con un magnetómetro SQUID a distancias de centímetros. Detectarlo a millas, a través de edificios y ruido electromagnético, violaría varias leyes conocidas de la física. La explicación más probable es tecnología de sensores clasificada que no es lo que describe la filtración, o una historia de cobertura para una fuente de inteligencia humana.

No voy a juzgar la física en una entrada de blog. Lo que diré es esto: cuando capacidades de IA no verificadas se asocian a operaciones clasificadas, hay que tomar la afirmación con mucha cautela. Estamos en la era en la que "lo hizo la IA" ha reemplazado a "lo hizo una fuente" como explicación predeterminada para resultados que nadie quiere explicar. Aplica el mismo escepticismo que aplicarías a cualquier otra filtración de inteligencia.

La única solución que realmente estoy usando: la Wikipedia personal de Karpathy

Si solo pruebas una cosa de las noticias de esta semana, que sea esta.

Andrej Karpathy publicó discretamente en código abierto una solución para la memoria de Claude que utiliza Obsidian como capa de almacenamiento. Llevo usándola cuatro días y ya ha reemplazado tres herramientas en mi flujo de trabajo.

La configuración es sencilla:

Instala Obsidian y la extensión Web Clipper
Conecta Obsidian a Claude Desktop mediante el sistema de archivos MCP
Carga el esquema de wiki proporcionado (temas, fuentes, conexiones)
Empieza a alimentar tu bóveda con documentos de investigación, recortes y notas
Claude lee toda la bóveda, sintetiza grafos de conocimiento conectados entre temas y escribe nuevas páginas de síntesis a medida que añades más material

Lo probé con tres artículos sin relación que había estado guardando: uno sobre la degradación de capacidades en LLM, otro sobre la adopción de automatización empresarial y otro sobre la economía laboral de la ingeniería de software. Le pedí a Claude que encontrara las conexiones. En menos de un minuto, había escrito una nota de síntesis argumentando que la degradación silenciosa de modelos de IA (primer artículo), la rápida automatización empresarial (segundo artículo) y la reestructuración de equipos de software (tercer artículo) son las tres caras de un mismo cambio subyacente: la optimización de costes impulsada por computación se está trasladando hacia abajo en la pila, y el efecto de segundo orden es la pérdida silenciosa de capacidades en las herramientas de las que dependen los trabajadores del conocimiento.

Eso es un artículo que podría escribir. Claude me redactó el esquema, con citas enlazadas a mis propias notas fuente.

Si leíste mi artículo anterior sobre Obsidian como el segundo cerebro de Claude, esta es la misma arquitectura, ahora formalizada en un esquema y flujo de trabajo que cualquiera puede replicar. Es lo más parecido a una memoria duradera de Claude que funciona hoy en día.

La historia de infraestructura que determina todos los precios

Detrás de cada lanzamiento de modelo esta semana hay un solo número: Anthropic acaba de firmar un acuerdo por 3,5 gigavatios de capacidad de TPU de Google a través de Broadcom, a partir de 2027.

Para ponerlo en contexto: el acuerdo original con Google Cloud de octubre aportaba 1 gigavatio en línea en 2026. Este nuevo acuerdo casi cuadruplica esa cifra. Los analistas de Mizuho estiman que Broadcom obtendrá $21 mil millones en ingresos de IA provenientes de Anthropic en 2026 y $42 mil millones en 2027.

La tasa de ingresos anual de Anthropic superó los $30 mil millones, frente a unos $9 mil millones a finales de 2025. Eso representa un crecimiento de 3,3 veces en menos de un año, partiendo de una base que ya era la de mayor escalabilidad en la historia del software empresarial.

De aquí se desprenden dos cosas.

Primero, la computación es ahora el verdadero foso defensivo. No la arquitectura del modelo, no los datos de entrenamiento: gigavatios brutos de inferencia eficiente en consumo energético. Quien controle el flujo de TPUs, controla la API por defecto para los próximos tres años. Google acaba de asegurarse un lugar en la capa de infraestructura de cada modelo de frontera que no sea propio.

Segundo, la historia de rendimiento de Claude con la que abrí debe leerse bajo este prisma. Anthropic se enfrenta a verdaderas limitaciones de computación mientras escala más rápido que cualquier empresa SaaS en la historia. Los valores predeterminados silenciosos que pasan de alto esfuerzo a esfuerzo medio no son una traición: son un sistema de racionamiento. El acuerdo de 3,5 gigavatios es la solución a largo plazo. Los presupuestos explícitos de razonamiento son el parche a corto plazo.

Los lanzamientos menores que merecen una línea cada uno

Algunas novedades que se lanzaron y no necesitan su propia sección, pero que no deberían pasar desapercibidas:

OpenClaw Native Video Generation unificó la generación de video de nueve modelos de IA (OpenAI, Google, Alibaba, entre otros) en una sola interfaz. Vale la pena instalarlo si generas video con frecuencia.
Cursor Remote Laptop Control via Phone — inicia tareas de codificación con IA en tu portátil desde el teléfono. Es de nicho, pero si sueles cambiar de contexto y alejarte de tu equipo, resuelve un problema real.
Gemini 4 offline vía OpenClaw — Google publicó una guía de tres pasos para ejecutar Gemini 4 completamente offline. Sin nube. Sin suscripción. El hecho de que Google esté enseñando activamente a los usuarios a desconectar su propio modelo dice mucho sobre hacia dónde se dirigen los costos de cómputo.

Qué Significa Realmente Esta Semana

Si ampliamos la perspectiva sobre los trece anuncios, tres patrones se imponen con fuerza.

Patrón uno: la degradación silenciosa ya es una categoría. El caso de Claude es el primero bien documentado, pero no será el último. Todos los grandes laboratorios tienen limitaciones de cómputo. Todos los grandes laboratorios cuentan con palancas que pueden accionar silenciosamente para gestionar la carga. Los usuarios deben asumir que los valores predeterminados que usaban hace seis meses ya no son los que usan hoy. La configuración explícita es supervivencia.

Patrón dos: la distribución está devorando a la inteligencia. Muse Spark no es el modelo más inteligente. Es el que la mayoría realmente usará, porque está dentro de WhatsApp. Claude dentro de Word no es la integración más avanzada. Es la que tocarán 1.200 millones de personas. Para los desarrolladores, la pregunta "¿de qué API me conecto?" está perdiendo importancia frente a "¿dónde ya vive mi usuario?"

Patrón tres: la capa open-source está subiendo en la pila. Netflix liberó como open-source un modelo de video consciente de la física. Karpathy liberó una capa de gestión de conocimiento. MiniMax liberó la semana pasada un LLM auto-mejorable. Aquello que hace 18 meses habría sido una ventaja propietaria, hoy son pesos públicos. Si estás construyendo un SaaS delgado sobre una API cerrada, tu foso está evaporándose. Si estás creando flujos de trabajo, pipelines e integraciones, estás construyendo justo donde se está acumulando el valor.

Antes de cerrar — una acción concreta. Elige la única cosa de esta lista que cambiaría tu martes por la mañana si la probaras, y reserva 30 minutos mañana para hacerlo. Para mí, fue la solución de Obsidian de Karpathy. Para ti, puede ser la beta de Word, o presupuestos explícitos de pensamiento en Claude Code, o descargar VOID y ejecutarlo sobre ese clip de video que te ha molestado durante un año.

La brecha entre quienes leen las noticias y quienes las prueban se amplía cada semana. Dentro de un año, los creadores que hayan probado tres cosas por semana serán intocables. Los que solo leyeron, seguirán leyendo.

Es martes. Elige una.

Preguntas Frecuentes

¿Claude Code realmente está empeorando o son solo mis prompts?

Ambas cosas pueden ser ciertas, pero los datos de AMD hacen innegable la regresión del modelo. El análisis de Stella Laurenzo sobre 6,852 sesiones mostró que las “lecturas por edición” cayeron de 6.6 a 2.0 y la profundidad de pensamiento bajó un 67% entre febrero y marzo de 2026. Anthropic confirmó que el esfuerzo de pensamiento por defecto se redujo de alto a medio el 3 de marzo. Establece explícitamente thinking_effort: high y proporciona el contexto manualmente desde el inicio.

¿Qué es Meta Muse Spark y debería cambiarme a él?

Muse Spark es el primer modelo de Meta proveniente de Superintelligence Labs, lanzado el 8 de abril de 2026. Obtuvo una puntuación de 52 en el Intelligence Index, por detrás de GPT-5.4 y Gemini 3.1 Pro. No cambies tu flujo de trabajo principal a este modelo, pero realmente es sólido en tareas multimodales de salud y viene integrado en WhatsApp, Instagram y Messenger, lo que significa que su relevancia es mayor para el alcance de consumidores que para herramientas de desarrollo.

¿Netflix VOID es realmente open source?

Sí. VOID está disponible en Hugging Face y GitHub bajo la licencia Apache 2.0. Requiere una GPU con suficiente VRAM para ejecutar la inferencia de CogVideoX, pero el modelo, los pesos y la metodología de entrenamiento son completamente públicos. Esto lo convierte en la herramienta de eliminación de objetos en video más potente disponible hasta abril de 2026.

¿Cuál fue el acuerdo de cómputo de Anthropic con Google y Broadcom?

Anthropic firmó un acuerdo por aproximadamente 3.5 gigavatios de capacidad de TPU de próxima generación de Google a través de Broadcom, comenzando en 2027. Analistas de Mizuho estiman que Broadcom generará $21 mil millones en 2026 y $42 mil millones en 2027 solo por Anthropic. Esto se suma al gigavatio ya previsto para entrar en línea en 2026 bajo el acuerdo original con Google Cloud.

¿Cómo configuro el sistema de memoria Karpathy Obsidian + Claude?

Instala Obsidian y la extensión Web Clipper, luego conecta Obsidian a Claude Desktop mediante un MCP de sistema de archivos. Carga el esquema de wiki público que compartió Karpathy y luego introduce tus documentos de investigación y recortes web en la bóveda. Claude lee toda la bóveda bajo demanda y sintetiza conocimiento conectado entre las notas. Para la guía completa, consulta mi publicación sobre Obsidian como el segundo cerebro de Claude.

Trabajemos Juntos

¿Buscas construir sistemas de IA, automatizar flujos de trabajo o escalar tu infraestructura tecnológica? Me encantaría ayudarte.

Fiverr (desarrollos e integraciones a medida): fiverr.com/s/EgxYmWD
Portafolio: mejba.me
Ramlit Limited (soluciones empresariales): ramlit.com
ColorPark (diseño y branding): colorpark.io
xCyberSecurity (servicios de seguridad): xcybersecurity.io

AI Weekly: El declive de Claude, Muse Spark y Netflix VOID