Launch Your Agent: Probé la Skill Gratuita de Anthropic

El agente llevaba diecinueve minutos funcionando y yo observaba cómo mi gasto en API subía en tiempo real como un taxímetro atascado en el tráfico.

Había pedido algo simple: un resumen diario de cinco publicaciones trending de Reddit, resumidas con un ángulo gancho para cada una. El tipo de cosa que normalmente resolvería con un cronjob y cuarenta líneas de Python. En cambio, dejé que la nueva Launch Your Agent skill de Anthropic me entrevistara, armara todo el proyecto y lo desplegara en la nube sin que yo escribiera una sola línea de código. La promesa era mágica. La realidad, en el minuto diecinueve, era un panel de Console mostrando retry tras retry — Reddit seguía rechazando las solicitudes del agente — y un contador de tokens que silenciosamente había cruzado los ocho dólares.

Esa tensión, entre "construí un agente en la nube en una conversación de cinco minutos" y "esta única ejecución me costó doce dólares y veintiocho minutos," es toda la historia. Así que déjame darte ambas mitades honestamente, porque la mayor parte de lo que se ha escrito sobre esta skill hasta ahora se lee como si hubiera sido copiado del README de GitHub sin que nadie realmente ejecutara la cosa.

Aquí está qué es la Launch Your Agent skill, exactamente cómo la instalé, qué produjo, dónde falló y si vale la pena aplicarla a un flujo de trabajo real.

¿Qué es la Launch Your Agent skill exactamente?

La Launch Your Agent skill es un conjunto gratuito y de código abierto de skills para Claude Code que te entrevista sobre una tarea y convierte tus respuestas en un Claude Managed Agent activo, alojado en la nube — sin código necesario. Se encuentra en github.com/anthropics/launch-your-agent bajo una licencia Apache 2.0.

Esa respuesta de una oración es la parte que Google y los motores de IA citarán, así que déjame ganarme el resto de tu scroll desglosando lo que realmente significa — porque hay tres cosas separadas enredadas aquí, y el marketing las difumina.

Cosa uno: la skill en sí. No es un producto con una página de facturación. Es una carpeta de Markdown y scripts que colocas en Claude Code. Cuando ejecutas /launch-your-agent, Claude lee esas instrucciones y se convierte en un entrevistador. El repositorio incluye dos skills: launch-your-agent (el flujo principal de cuatro fases) y wrap-up (un complemento que resume tu agente y sugiere mejoras). Anthropic lo entrega como una implementación de referencia — el README dice claramente que "no se mantiene ni acepta contribuciones." Eso importa, y volveré a ello.

Cosa dos: Claude Managed Agents (CMA). Esta es la infraestructura pagada real donde la skill despliega. CMA es el entorno de ejecución alojado de Anthropic que se lanzó el 8 de abril de 2026 y recibió su historia de alojamiento de agentes en Code with Claude en mayo. Tú escribes la lógica del agente; Anthropic la ejecuta en un contenedor aislado, maneja el estado y la ejecución de herramientas, y te cobra tarifas estándar de tokens de la API de Claude más $0.08 por hora de sesión. Si quieres el análisis profundo de la plataforma, escribí una prueba práctica completa sobre Anthropic Managed Agents y lo que la beta todavía hace mal — esta publicación es sobre la skill que funciona encima, no la plataforma debajo.

Cosa tres: la idea del "loop". Este es el marco conceptual que Anthropic envuelve alrededor de todo, y es la parte donde vale la pena ir más despacio.

Probablemente te imaginas la skill como un llenador de formularios elegante. Es más interesante que eso. Quédate conmigo.

El modelo mental: no estás escribiendo prompts, estás escribiendo loops

Aquí está el cambio que me tomó una segunda ejecución para realmente sentir.

Cuando escribes un prompt, le das instrucciones a Claude: haz esto, luego esto, formatealo así. Tú eres responsable de la calidad del resultado. Si está mal, es porque tu prompt estaba mal.

Un loop invierte eso. Le das a Claude un objetivo, algo de contexto y un conjunto de criterios de éxito — y entonces Claude es responsable de la calidad. Planifica, elige herramientas, las ejecuta, califica su propia salida contra los criterios que le diste, y si no alcanza el nivel, lo intenta de nuevo. El loop sigue girando hasta que la salida supera el listón o se agota el presupuesto.

Tres inputs alimentan cada loop:

Contexto — información de fondo que el agente necesita. Para mi resumen: "la audiencia son constructores indie de IA, prioriza publicaciones de menos de 24 horas, ignora threads de memes."
Objetivo — lo que realmente quieres que se produzca. "Cinco publicaciones trending, cada una con un resumen de dos líneas y un ángulo gancho."
Criterios de éxito — cómo sabe el agente que hizo un buen trabajo. "Cada entrada tiene un enlace fuente funcional, un ángulo distinto y se lee en menos de quince segundos."

Ese tercer input es el que todos subestiman. Sin criterios de éxito explícitos, el agente no tiene nada contra qué calificarse, así que el loop se detiene demasiado pronto o gira indefinidamente. La Launch Your Agent skill dedica una buena parte de su entrevista a extraer esos criterios de ti, y ese interrogatorio es, honestamente, lo más valioso que hace — más sobre esto abajo.

Piénsalo como la diferencia entre darle a un empleado junior una lista de verificación versus darle una definición de "terminado" y la autoridad para descifrar los pasos. La lista de verificación escala peor. La definición de terminado escala, pero solo si la escribes con precisión. El loop es lo segundo, productizado.

Ahora, la teoría es barata. Déjame mostrarte qué pasó cuando realmente lo instalé.

Cómo instalé la Launch Your Agent skill en Claude Code

Hice esto en una máquina limpia — Claude Code v2.1.101, macOS, sesión iniciada — específicamente para poder escribir cada paso en lugar de pasar por alto la parte de "y luego simplemente funciona". Tiempo total desde clone hasta la primera pregunta de la entrevista: menos de tres minutos.

Paso 1 — Clona el repositorio y abre Claude Code. El repositorio es pequeño. No hay npm install, no hay paso de build, nada que compilar.

# Clona el repositorio de referencia de Anthropic
git clone https://github.com/anthropics/launch-your-agent
cd launch-your-agent

# Inicia Claude Code desde dentro del repositorio
claude

La razón por la que inicias Claude Code desde dentro del repositorio es que Claude Code auto-descubre skills que están en un directorio .claude/skills/. No hay un comando separado de "instalar esta skill" — coloca los archivos en el lugar correcto, inicia Claude Code, y los detecta. Esa es toda la "instalación."

Paso 2 — Invoca la skill. Dentro de la sesión de Claude Code, escribe:

/launch-your-agent

Esto inicia la skill principal de cuatro fases. El complementario /wrap-up también se vuelve disponible — lo ejecutas después de que tu agente esté activo para obtener un resumen de estado.

Paso 3 — Conecta una clave API. Este es el paso que los tutoriales rápidos omiten, y es el que realmente te cuesta dinero. La skill despliega en Claude Managed Agents, y CMA funciona con tu propia cuenta de Anthropic. Así que necesitas una clave API de platform.claude.com → API keys. Crea una, y la skill la almacena localmente en un archivo .env — nunca pegada en el transcripto del chat, que es la decisión correcta para una credencial.

Consejo profesional: antes de generar esa clave, establece un límite de gasto estricto en la clave API misma en la Console. Yo no lo hice la primera vez. Puedes adivinar hacia dónde va esto.

Paso 4 — Responde la entrevista. Una vez que la clave está en su lugar, la skill comienza a hacer preguntas. Aquí es donde ocurre el trabajo real, y merece su propia sección.

Si has usado skills de Claude Code antes, nada de esto te sorprenderá — es el mismo patrón de descubrimiento .claude/skills/ que cubrí en mi análisis de Agent Skills avanzadas en Claude Code. Lo nuevo es lo que la skill hace con ese patrón: no te ayuda a escribir código, te entrevista hacia un despliegue.

La entrevista es el verdadero producto

Entré esperando un asistente de configuración glorificado. Lo que obtuve se sintió más como un PM astuto acorralándome en un pasillo hasta que admití lo que realmente quería.

La skill — ejecutándose como Fase 1 de cuatro (Interview → Stage & Launch → Grade & Iterate → Run Without You) — trabajó aproximadamente estas áreas:

¿Qué hace el agente? No "resume Reddit" sino la forma específica del output. Empujó de vuelta cuando mi primera respuesta fue vaga.
¿Cuál es el formato de salida? ¿Digest en Markdown? ¿Email? ¿Una fila en una hoja de cálculo? Quería el artefacto, concreto.
¿Quién es la audiencia y cuáles son las fuentes de datos? Aquí dije "constructores indie de IA" y "Reddit, específicamente r/LocalLLaMA y r/ChatGPT."
¿Cuáles son los criterios de éxito y la rúbrica de calificación? La parte que mencioné antes. Me obligó a definir cómo se ve un digest bueno versus uno mediocre, en términos contra los que realmente pudiera puntuar.
¿Con qué frecuencia debe ejecutarse? Diario, semanal, bajo demanda. Elegí diario a las 7 a.m.

Luego hizo algo que no esperaba: definió una v0 — una primera versión deliberadamente mínima — en lugar de intentar construir mi agente soñado completo en el primer intento. Me dijo, esencialmente, "pongamos la versión útil más pequeña en producción, califiquémosla y luego escalemos." Esa es buena disciplina de ingeniería integrada en una skill, y es la razón principal por la que un no programador puede usar esto sin producir un lío enredado.

Cuando la entrevista terminó, la skill generó una carpeta my-agent/. Quiero ser específico sobre lo que contiene, porque esta es la parte que lo hace legible en vez de mágico:

Una hoja de construcción — la especificación legible por humanos de lo que se está desplegando.
Los payloads exactos de la API — el JSON literal que la skill envía a la API de CMA. Puedes leerlo, auditarlo y reutilizarlo.
Un script de lanzamiento reanudable — para que si un despliegue muere a la mitad, lo vuelvas a ejecutar en lugar de empezar de cero.
Un scaffold de evaluación — el arnés de calificación que puntúa cada ejecución contra tus criterios.
Una página de resumen — un resumen tipo dashboard generado.
NEXT-DIRECTIONS.md — un roadmap v1/v2 de mejoras para después.

Esa carpeta es la diferencia entre "una IA hizo algo opaco en la nube" y "aquí está la definición exacta, inspeccionable y controlable por versiones de mi agente." No puedo exagerar cuánto importa esa transparencia de artefactos una vez que estás gastando dinero real en ejecuciones.

Has pasado el setup. Ahora la parte honesta — qué pasó cuando realmente lo dejé ejecutarse.

Qué pasó cuando lancé mi primer agente

La Fase 2 (Stage & Launch) envió mi v0 a Claude Managed Agents. En la Console, apareció un nuevo agente con su entorno, y la skill activó la primera ejecución calificada.

Luego me recosté a observar el dashboard, que muestra historial de sesiones, llamadas API y resultados por ejecución. Y aquí es donde se abrió la brecha entre demo y realidad.

La tarea del agente necesitaba datos de Reddit. El agente no podía obtener datos de Reddit de manera confiable. Los endpoints de Reddit seguían rechazando las solicitudes — límites de tasa, bloqueos de acceso, la hostilidad habitual que las APIs públicas muestran a cualquier cosa que huela a automatización. Así que el loop hizo exactamente lo que hacen los loops: falló en un paso, evaluó e intentó de nuevo. Y otra vez. Cada retry quemó tokens.

Tres números duros de esa primera ejecución, y te doy los reales, no los favorecedores:

~28 minutos de tiempo real, casi todo gastado en reintentos y manejo de errores, no en trabajo productivo.
~$12 en costos de API por una sola ejecución, impulsados por alto uso de tokens mientras el loop masticaba razonamiento de clase Opus en cada reintento. (Opus 4.8 cuesta $5 entrada / $25 salida por millón de tokens, y un loop atascado genera muchos tokens de salida.)
5 historias trending en el digest final — porque a pesar del caos, eventualmente produjo una salida utilizable, con enlaces y comentarios.

Entonces: funcionó. También costó más que un mes de algunas suscripciones SaaS, por un solo resumen diario. Si eso corriera cada mañana sin supervisión, estaría mirando aproximadamente $360 al mes por un resumen de Reddit. Eso no es un error tipográfico, y es el tipo de matemática que nadie menciona en los hilos de lanzamiento.

Aquí está la parte que lo redimió, sin embargo. La Fase 3 de la skill (Grade & Iterate) no simplemente me entregó el desastre costoso y se encogió de hombros. Calificó la ejecución, notó que las fallas de Reddit eran el factor de costo, y recomendó cambiar la fuente de datos a solo búsqueda web — eliminar la dependencia inestable de Reddit, obtener discusiones trending a través de búsqueda en su lugar, reducir tanto la tasa de errores como el consumo de tokens. El agente diagnosticó su propio modo de falla más costoso y propuso la solución. Eso es el loop demostrando su valor.

La opinión honesta: dónde esta skill es brillante y dónde muerde

He ejecutado esto en tres ideas de tareas diferentes — el digest de Reddit, un observador de precios de la competencia y un resumidor diario de changelog para un repositorio que sigo. Surgieron patrones. Déjame darte las compensaciones que nadie pone en sus titulares.

Lo que genuinamente hace bien:

El pipeline de entrevista a despliegue es la verdadera innovación, no el alojamiento en la nube. He visto muchas herramientas de "agente de IA sin código", y todas fallan de la misma manera: hacen fácil empezar e imposible saber si el resultado es bueno. Esta skill invierte eso al forzar criterios de éxito de antemano y luego calificar contra ellos. Los artefactos de my-agent/ significan que nunca estás atrapado — puedes leer los payloads exactos, versionarlos en git y abandonar la skill por completo mientras mantienes el agente. Ese es un diseño inusualmente honesto para algo dirigido a principiantes.

Donde muerde — y esto es real:

La confiabilidad de herramientas de terceros es tu problema, no el de la skill. El muro de Reddit no fue un bug en Launch Your Agent. Es la realidad de que la web abierta combate el acceso automatizado, y un loop que reintenta fallas convertirá felizmente esa fricción en una hoguera de tokens de cinco cifras. Antes de apuntar un agente a una fuente de datos, pregúntate: ¿esta fuente dejará entrar a un bot? Si la respuesta es inestable, el loop lo descubrirá de la manera costosa.

El modelo de costos recompensa la precisión y castiga la vaguedad. Un objetivo ajustado con criterios de éxito claros converge en pocas iteraciones baratas. Un objetivo vago gira sin parar. Como el agente es responsable de la calidad, una definición difusa de "terminado" significa que sigue intentando alcanzar un objetivo que nunca dibujaste claramente. Tu gasto es directamente proporcional a qué tan descuidadas fueron tus respuestas en la entrevista. Si te tomas en serio mantener estas facturas manejables, mi guía de optimización de costos de agentes IA cubre las tácticas de disciplina de tokens que más importan aquí.

"Implementación de referencia, sin mantenimiento" es una advertencia real. El repositorio lo dice directamente. Esto es Anthropic mostrándote un patrón, no entregándote un producto soportado. Cuando la API de CMA cambie — y una API en beta pública cambiará — la skill no recibirá un parche. Estás adoptando una instantánea. Bien para aprender y prototipar. Piénsalo mejor antes de construir un flujo de trabajo crítico para el negocio sobre un scaffold explícitamente sin mantenimiento.

Si prefieres que alguien diseñe estos agentes para que converjan de manera económica y no se atasquen en fuentes de datos inestables, eso es una buena parte de lo que construyo para clientes — puedes ver el tipo de trabajo de automatización que acepto en fiverr.com/s/EgxYmWD.

Esa es la experiencia. Ahora déjame hacer zoom out hacia lo que significa para cómo deberías realmente usar la cosa.

Cuándo esta skill vale la pena (y cuándo gana un cronjob)

El error que casi cometí fue tratar Launch Your Agent como un reemplazo para toda automatización. No lo es. Aquí está el marco de decisión al que llegué después de tres ejecuciones.

Usa la skill cuando:

La tarea es genuinamente intensiva en juicio — resumir, priorizar, clasificar, escribir — donde un script determinístico no puede capturar "bueno." El loop de calificación justifica su costo cuando la calidad es subjetiva.
La tarea se repite y de otro modo la supervisarías. Los despliegues programados de CMA (horarios cron, ahora en beta pública desde el 9 de junio de 2026) dejan que un agente se ejecute solo; obtienes pausar, reanudar, archivar y reejecuciones bajo demanda, con un límite organizacional de 1,000 despliegues programados.
Las fuentes de datos son amigables con la automatización — tus propias APIs, búsqueda web, servicios con credenciales inyectadas desde vault (CMA puede inyectar secrets en el sandbox en tiempo de ejecución sin que el modelo los vea nunca).

Omítelo y escribe el cronjob cuando:

La tarea es determinística. Si un script de cuarenta líneas produce exactamente la respuesta correcta cada vez, un loop LLM es una manera estrictamente más cara de obtener un resultado peor definido. No pagues tarifas de Opus para hacer if/else.
La fuente de datos es hostil con los bots (te miro a ti, Reddit) y no tienes acceso legítimo a la API. El loop reintentará dentro de tu billetera.
Necesitas costos ajustados y predecibles. Un script cuesta centavos en computación. Un loop de razonamiento cuesta lo que sea necesario para satisfacer tus criterios, lo cual no puedes predecir perfectamente de antemano.

Esto conecta con un cambio más grande sobre el que sigo escribiendo: la unidad de automatización se está moviendo de scripts que mantienes a objetivos que delegas. Profundicé en el lado siempre activo y programado de eso en mi artículo sobre ejecutar loops de Claude Code en un horario cron. La Launch Your Agent skill es la rampa de acceso más amigable a ese mundo que he encontrado — siempre que entres sabiendo que es un taxi con taxímetro, no una suscripción de tarifa plana.

Lo que te aconsejaría hacer realmente

No despliegues un agente diario en tu primera ejecución. Ese fue mi error, y es evitable.

Aquí está la secuencia que me habría ahorrado once dólares y mucho mirar el dashboard:

Instala la skill y ejecuta la entrevista con una tarea real — pero para el primer agente, elige algo con una fuente de datos amigable. Tus propios archivos, tu propia API o búsqueda web simple. No Reddit. No nada que combata scrapers.
Establece un límite de gasto en la clave API en la Console primero. Un límite de $5 en una clave nueva convierte "perdí el rastro del costo" en "la ejecución se detuvo sola." Seguro barato.
Ejecútalo una vez, bajo demanda. Lee la salida calificada y la carpeta my-agent/. Trata la primera ejecución como una lección pagada de cómo se comporta el loop con tu tarea, no como producción.
Solo entonces prográmalo. Una vez que hayas visto una ejecución limpia y barata, activa el despliegue cron. Ahora estás automatizando una cantidad conocida en lugar de un signo de interrogación.
Ejecuta /wrap-up para obtener el resumen y las mejoras sugeridas, y luego decide si la v1 vale el gasto.

La lección más grande debajo de todo esto: la skill no hizo la automatización fácil. Hizo fácil definir el objetivo — y luego expuso despiadadamente cada lugar donde mi definición era descuidada, cobrándome por el descuido en tokens reales. Eso no es un defecto. Es el loop de retroalimentación más honesto que he recibido de una herramienta de IA en bastante tiempo.

Así que aquí está la pregunta con la que te dejo, la misma que el agente básicamente me hizo en el minuto diecinueve: si tuvieras que escribir los criterios de éxito exactos para una tarea que haces todos los días — la definición precisa de "bien hecho" — ¿podrías? Porque en el momento en que puedas, puedes entregárselo a un loop. Y en el momento en que no puedas, habrás encontrado la parte de tu trabajo que nunca iba a ser automatizada de todos modos.

Preguntas Frecuentes

¿Qué es la Launch Your Agent skill para Claude Code?

La Launch Your Agent skill es un conjunto gratuito y de código abierto de skills para Claude Code de Anthropic que te entrevista sobre una tarea y la despliega como un Claude Managed Agent activo y alojado en la nube sin ningún código. Incluye dos skills, launch-your-agent y wrap-up, bajo una licencia Apache 2.0 en github.com/anthropics/launch-your-agent. Para la guía completa de instalación, consulta la sección de instalación arriba.

¿Es gratuita la Launch Your Agent skill?

La skill en sí es gratuita y de código abierto, pero despliega en Claude Managed Agents, que te cobra tarifas estándar de tokens de la API de Claude más $0.08 por hora de sesión en tu propia cuenta de Anthropic. Mi primera ejecución real costó aproximadamente $12 porque el loop seguía reintentando una fuente de datos inestable — así que "skill gratuita" no significa "gratis para ejecutar."

¿Cómo instalo la Launch Your Agent skill?

Clona el repositorio con git clone https://github.com/anthropics/launch-your-agent, haz cd en él, ejecuta claude para abrir Claude Code desde la carpeta, y luego escribe /launch-your-agent. Claude Code auto-descubre skills en .claude/skills/, así que no hay un paso de instalación separado. También necesitarás una clave API de Anthropic de platform.claude.com.

¿Qué es un Claude Managed Agent (CMA)?

Un Claude Managed Agent es un agente alojado en la nube que Anthropic ejecuta en un contenedor aislado en su propia infraestructura, manejando sandboxing, estado y ejecución de herramientas, mientras te cobra por token más $0.08 por hora de sesión. Desde junio de 2026, CMA soporta despliegues programados tipo cron y credenciales inyectadas desde vault en beta pública. La Launch Your Agent skill es una forma de crear uno.

¿Por qué costó tanto mi ejecución de Launch Your Agent?

Las ejecuciones se vuelven caras cuando el loop reintenta repetidamente un paso que falla — en mi caso, Reddit rechazó las solicitudes del agente, y cada reintento quemó tokens de clase Opus a $5 entrada / $25 salida por millón. Los criterios de éxito vagos lo empeoran, porque el loop sigue intentando alcanzar un objetivo indefinido. Criterios ajustados y fuentes de datos amigables con la automatización mantienen los costos bajos.

Trabajemos Juntos

¿Buscas construir sistemas de IA, automatizar flujos de trabajo o escalar tu infraestructura tecnológica? Me encantaría ayudar.

Fiverr (builds personalizados e integraciones): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (soluciones empresariales): ramlit.com
ColorPark (diseño y branding): colorpark.io
xCyberSecurity (servicios de seguridad): xcybersecurity.io

Launch Your Agent: Probé la Skill Gratuita de Anthropic