Contenido Sistema operativo: Claude Code + Higgsfield + Codex
La notificación llegó a las 11:09 p.m. de un domingo. Un creador al que sigo había publicado un tutorial titulado algo así como "Construya un sistema operativo de contenido completo con Claude, Higgsfield 2 y Codex". Lo marqué como favorito, me dije que lo vería el martes y luego ignoré esa promesa en una hora. A medianoche tenía el vídeo abierto en un segundo monitor, mi terminal en el primero y una nueva carpeta de proyecto llamada content-os-test esperando el primer comando. El discurso era lo suficientemente simple como para resultar sospechoso: un CLI, una ventana de aviso, sitios web, imágenes, videos, audio y avatares animados, todos saliendo por el otro extremo. No creí la demostración. Necesitaba ejecutarlo.
Lo que estoy a punto de ver no es un resumen de ese video. Es el registro de compilación de mi propia versión, que se ejecuta dentro de la pila real que uso todos los días: Claude Code como cerebro, el nuevo MCP de Higgsfield 2 para elementos visuales, Codex CLI como tiempo de ejecución paralelo cuando quiero una segunda opinión y una pila de archivos skill.md que me permiten Vuelvo a ejecutar cualquiera de estas canalizaciones como un solo comando. He estado creando contenido multimarca durante años en mejba.me, ramlit.com, colorpark.io y xcybersecurity.io, así que entré en esto con ojos claros sobre lo que es real y lo que es magia de demostración.
Al final de una sesión, tenía una página de inicio animada funcional, una imagen de héroe de 16:9 generada a través de Nano Banana 2, un video de héroe de cinco segundos activado por desplazamiento, un avatar personalizado entrenado en un puñado de fotos cargadas y tres habilidades reutilizables en ~/.claude/skills/ que puedo activar desde cualquier proyecto futuro. El contador de crédito terminó en 387 quemados de 1000 en mi mochila. Más barato que una sola hora de autónomo. Vale más que una semana de cambio de contexto entre cinco aplicaciones diferentes.
Permítanme mostrarles exactamente cómo surgió y dónde el término "sistema operativo de contenido" realmente comienza a significar algo en lugar de ser una palabra de moda.
Qué será realmente un sistema operativo de contenidos en 2026
Quiero ser honesto acerca de esto desde el principio porque la frase se usa de cinco maneras diferentes en YouTube en este momento. Un sistema operativo de contenidos no es un producto único que puedas comprar. No existe ninguna aplicación en la App Store llamada "Content OS". Cualquiera que te venda uno te está vendiendo un envoltorio.
Lo que realmente es en 2026: una pila unida donde el tiempo de ejecución de un agente mantiene su contexto, múltiples motores de generación se conectan a él a través de un protocolo estándar y flujos de trabajo reutilizables convierten tareas repetitivas en comandos de una sola línea. En mi configuración las piezas se ven así:
- Claude Code es el orquestador. Mantiene el contexto de la marca, elige qué modelo llamar para cada trabajo, escribe HTML y CSS, guarda archivos en los lugares correctos y encadena pasos sin que yo haga clic en nada. - Higgsfield 2 MCP es el motor creativo. Expone más de treinta modelos de imágenes y videos (Nano Banana 2, Soul 2.0, Sora 2, Veo 3.1, Kling 3.0, Seedance 2.0, Flux 2, Wan 2.7, MiniMax Hailuo 02) a través de un servidor Model Context Protocol. Según la propia página MCP de Higgsfield, el servidor se envió oficialmente el 30 de abril de 2026. - Codex CLI es el segundo tiempo de ejecución que sigo ejecutando para trabajo paralelo.
El agente de codificación de OpenAI ejecuta GPT-5.4 y lo uso cuando quiero una perspectiva diferente sobre el mismo problema o cuando Claude está en mitad de la refactorización y no quiero interrumpirlo. Escribí sobre por qué ejecuto Codex y Claude Code como configuración de agente dual en lugar de elegir uno. - Habilidades (archivos Skill.md) son los flujos de trabajo. Cada uno es un pequeño archivo de rebajas que le enseña al agente cómo ejecutar un canal específico: "crear una imagen heroica al estilo Ghibli", "crear una página de inicio de producto", "presentar un video en bucle de desplazamiento de cinco segundos". Una vez que existe una habilidad, no tengo que volver a explicar ese flujo de trabajo.
Esa es toda la pila. Observe lo que falta: ni Figma, ni Photoshop, ni Premiere, ni DaVinci, ni un creador de sitios web separado, ni la pestaña Runway, ni Midjourney Discord, ni el panel de control de ElevenLabs, ni nada de Adobe. Se puede acceder a todos los modelos que necesito desde una terminal porque Higgsfield los agrega y MCP los expone como comandos.
La razón por la que esto es importante es una a la que sigo volviendo: la rotación de modelos AI es brutal. Hace seis meses ninguno de los modelos que acabo de enumerar existía en su forma actual. Nano Banana 2 se envió en febrero de 2026. Sora 2 reemplazó a Sora 1. Kling saltó de 2 a 3,0 a 3,06. Seedance pasó de 1,5 a 2,0. Veo pasó de 3 a 3,1. Si construye su flujo de trabajo en torno a un modelo directamente, dedica la mitad de su tiempo a volver a cablearlo. Si lo construye alrededor de un MCP que abstrae los modelos, intercambia una cadena y continúa trabajando.
Por qué MCP cambia las matemáticas en los flujos de trabajo multimodelo
Antes de continuar con la instalación, una breve barra lateral sobre por qué el protocolo de contexto del modelo es importante aquí específicamente. Esta es la parte que la mayoría de los tutoriales pasan por alto y es la parte que hace que toda la pila esté preparada para el futuro.
MCP, publicado originalmente por Anthropic a finales de 2024, es una forma estandarizada para que los agentes AI se comuniquen con herramientas externas. En lugar de que cada herramienta cree su propia integración personalizada, la herramienta se expone una vez como un servidor MCP. Cualquier agente que hable MCP (Claude Code, Codex, Cursor, el IDE Antigravity de Anthropic) puede usarlo sin cableado personalizado.
Cuando Higgsfield envió su servidor MCP, ese movimiento hizo algo silenciosamente importante: hizo que todos los modelos en Higgsfield estuvieran disponibles para todos los agentes compatibles con MCP simultáneamente. Instalo MCP una vez. Claude Code puede llamar a Nano Banana 2. También Codex. También puede hacerlo cualquier tiempo de ejecución de agente futuro que exista. Si Higgsfield agrega Veo 4 el próximo mes, no cambio mi código. El MCP lo expone y mis habilidades actuales lo captan.
Esta es la razón por la que ya no apuesto por el modelo individual API. Tenía un flujo de trabajo creado directamente en Runway Gen-3 API a principios de 2025. Cuando Runway envió Gen-4 con un esquema diferente, reescribí todo. Luego tuve que reescribir nuevamente cuando quise comparar la salida de Kling. Por otra parte para Veo. El enfoque CLI/MCP elimina todo ese bucle. Higgsfield MCP es la capa de abstracción que debería haber estado construyendo todo el tiempo.
La instalación: Higgsfield MCP Dentro de Claude Code
La instalación es realmente sencilla, lo cual es poco común en esta categoría. La [página MCP] de Higgsfield (https://higgsfield.ai/mcp) enumera tres tipos: MCP para Claude Code, CLI para cualquier agente y un paquete de habilidades. Fui con los tres.
Paso uno: instale MCP en Claude Code. Desde cualquier terminal:
claude mcp add higgsfield -- npx -y @higgsfield/mcp-server
Esto agrega Higgsfield como servidor MCP a la configuración de Claude Code y extrae el paquete del servidor de npm. La primera vez que llama a cualquier herramienta Higgsfield, ejecuta un flujo OAuth en su navegador y vincula su cuenta Higgsfield existente. No hay claves API para copiar y pegar. Si ya tiene un plan Higgsfield, sus créditos se transfieren automáticamente.
Paso dos: instale el paquete de habilidades oficial. Esta parte es lo que le brinda al agente flujos de trabajo prediseñados para sesiones de fotos de productos, videos de marketing, entrenamiento de personajes y generación de imágenes:
npx skills@higgsfield/ai-skills
El instalador interactivo plantea tres preguntas: alcance de la instalación (elegí global), qué habilidades habilitar (tomé higgsfield-generate, higgsfield-product-photoshoot y higgsfield-soul-id) y a qué agente vincularme (Claude Code). El tiempo total de instalación fue de unos noventa segundos, la mayor parte de los cuales fueron dependencias de extracción de npm.
Paso tres (opcional pero lo hago): repita la instalación de MCP para Codex. La razón son las carreras paralelas. Si Claude procesa un video que demora cuatro minutos, quiero seguir iterando la copia en Codex sin esperar. Codex tiene su propio soporte MCP y el mismo patrón mcp add funciona allí con un indicador de configuración diferente. El ~/.codex/config.toml vive en un lugar diferente pero el cableado es idéntico.
Después de la instalación, inicié Claude Code y ejecuté /skills para confirmar el registro. Aparecieron tres nuevas entradas: higgsfield-generate, higgsfield-product-photoshoot y higgsfield-soul-id. Además de comandos de utilidad para saldo crediticio, estado laboral y listado de activos. El CLI transmitió en vivo.
Una rápida comprobación de la realidad sobre los permisos. Las habilidades Higgsfield suponen que el agente puede escribir archivos en el disco sin pedir permiso para cada operación. Ejecuto esta canalización con claude --dangerously-skip-permissions en una carpeta de proyecto temporal. No en mi monorepo principal. En ningún lugar donde no pueda reconstruir desde cero en cinco minutos. Si está nervioso, ejecútelo en una carpeta nueva que pueda rm -rf después. La bandera está bien cuando el radio de explosión está contenido. Es peligroso cuando no lo es.
Primera prueba: generación de una imagen de héroe estilo Ghibli 16:9 con Nano Banana 2
Elegí la misma prueba que utilizó el tutorial original: una imagen estilo Studio Ghibli 16:9 de tres Springer Spaniels ingleses. Lo suficientemente específico como para tener una respuesta correcta clara. Lo suficientemente estilístico como para que un modelo genérico produzca papilla y uno bueno produzca algo encantador.
Escribí en Claude:
Genere una imagen estilo Ghibli de 16:9 de tres Springer Spaniels ingleses corriendo por un prado de flores silvestres en la hora dorada. Utilice Nano Banana 2. Guardar en salidas/hero-spaniels-v1.png.
Claude lo dirigió a través de Higgsfield MCP, eligió el modelo Nano Banana 2 según mi rápida mención, con un tamaño de 16:9 y ejecutó el trabajo. El crédito alcanzado fue de 2 créditos por iteración en la resolución estándar de 2K: Nano Banana 2 es uno de los modelos más baratos del catálogo Higgsfield en este momento. Pedí cuatro iteraciones, que me costaron 8 créditos en total. Cuarenta y cinco segundos después tenía cuatro archivos en outputs/.
El primero fue sinceramente impresionante. Trazos suaves pintados por Ghibli, tres perros claramente dibujados, profundidad en el prado, el tipo de luz de hora dorada alrededor de la cual Studio Ghibli construye películas enteras. El segundo tenía un cuarto perro escondido en el fondo al que podía tratar como un insecto o como un personaje. El tercero estuvo un poco embarrado. El cuarto fue el portero.
Esa es la parte que la gente pasa por alto cuando piensa en el costo generativo de AI. La unidad económica no es "una imagen", sino "un guardián entre N". En Nano Banana 2, a 2 créditos por iteración, pagaba el equivalente a unos trece centavos por iteración y aproximadamente cincuenta y dos centavos por el guardián. Para una imagen destacada lo suficientemente buena como para publicarse en una página de destino real, cincuenta y dos centavos es el tipo de cifra que destruye silenciosamente los presupuestos tradicionales de fotografías de archivo.
He escrito antes sobre cómo pensar en el cálculo de costos de estas herramientas, y la versión corta es: el precio del modelo por iteración importa menos que cuántas iteraciones se necesitan para conseguir un guardián. Los modelos baratos que necesitan ocho intentos para aterrizar son más caros que los modelos de nivel medio que aterrizan en dos. Nano Banana 2 aterriza en uno o dos para la mayoría de las indicaciones. Ese es el valor.
El archivo de habilidades que hace que esto sea repetible
Aquí está la parte que el video original señala pero que no muestra. El objetivo de ejecutar esta canalización una vez es no ejecutarla nunca de la misma manera dos veces: cada flujo de trabajo se guarda como skill.md, por lo que la siguiente ejecución es un comando de una línea.
Guardé el proceso de héroe de Ghibli como una habilidad en ~/.claude/skills/ghibli-hero-image/skill.md. El archivo se ve así:
---
name: ghibli-hero-image
description: Generate a Ghibli-style hero image at 16:9 using Nano Banana 2 through Higgsfield MCP. Use when the user asks for a soft, painted, animated-film-style hero or banner.
---
When invoked, do the following:
1. Ask the user for the subject of the image (one sentence is enough).
2. Construct a Higgsfield prompt with these locked elements:
- Style: "Studio Ghibli, soft painted strokes, hand-drawn animation aesthetic"
- Lighting: "golden hour, warm directional light"
- Composition: "16:9, cinematic depth, foreground subject + meadow or natural backdrop"
3. Call higgsfield-generate with model = nano-banana-2, aspect = 16:9, iterations = 4.
4. Save outputs to ./outputs/ with filenames hero-{subject-slug}-v1.png through v4.png.
5. Print a summary table: filename, credit cost, prompt used, recommended pick (the agent's best guess at the keeper).
Cost expectation: 8 credits for 4 iterations on Nano Banana 2. Total runtime ~45 seconds.
Avoid: photorealism, hard digital edges, flat color blocks. Reject any output that looks 3D-rendered.
Todo el archivo tiene aproximadamente treinta líneas. Una vez que está en el disco, cada futuro héroe de Ghibli es un comando. Escribo "Usar la habilidad ghibli-hero-image para [sujeto]" en Claude y el agente ejecuta todo el proceso, escribe resultados y me dice cuál cree que es el guardián. La próxima vez que quiera una imagen principal para una publicación de blog colorpark.io, esa será toda la interacción.
Este es el desbloqueo. Los modelos seguirán batiéndose. Los oleoductos no deberían hacerlo. Cada flujo de trabajo reutilizable que guarde como habilidad es un flujo de trabajo que no tendrá que recordar el próximo mes. He escrito sobre cómo el sistema de habilidades del agente remodela todo este patrón, y los archivos Skill.md son el formato de archivo de mayor apalancamiento que he usado en el último año.
Creación del sitio web: inspiración para el sistema de diseño estilo Spotify
La siguiente prueba fue la más difícil. El video mostraba a Jack alimentando a Claude con un repositorio real del sistema de diseño GitHub como inspiración y pidiéndole que creara una página de destino con ese estilo. Quería ir más allá. Elegí el lenguaje de diseño de Spotify como referencia (los fondos oscuros, el acento verde, el tipo de pantalla gruesa, la sensibilidad de la cuadrícula de la portada del álbum) y le pedí a Claude que diseñara una página ficticia de lanzamiento de producto con ese ambiente.
El mensaje que utilicé:
Cree una página de inicio de una página para un producto ficticio llamado "Vinyl Memory", un servicio que convierte su historial de escucha de Spotify en un disco de vinilo personalizado. Lenguaje de diseño: el sitio web de Spotify, pero más oscuro y premium. Utilice una tipografía real al estilo de Spotify (Spotify Mix o Inter como alternativa), el sistema de color verde sobre negro, generosos espacios en blanco y secciones de cuadrícula de portada de álbum. Genere un único index.html con CSS incrustado.
Claude produjo alrededor de 380 líneas de HTML y CSS en la primera pasada. La estructura era correcta: héroe con la maqueta del producto, tres bloques de funciones, una línea de tiempo de "cómo funciona", una sección de cuadrícula de álbum que muestra registros de ejemplo, una CTA de registro de correo electrónico y un pie de página. Los colores estaban cerca. La tipografía usaba Inter como alternativa porque el agente no podía extraer Spotify Mix de ningún lugar confiable, lo cual está bien: Inter es un buen sustituto.
En el segundo pase es donde se puso interesante. Le pedí a Claude que generara tres imágenes de productos para la sección de cuadrícula del álbum usando Higgsfield. El mensaje:
Para la cuadrícula del álbum, genere tres portadas de discos de vinilo en Higgsfield usando Nano Banana 2. Cada una debe reflejar un arquetipo de oyente diferente: malhumorado a altas horas de la noche, conducción en verano, modo de trabajo concentrado. Formato cuadrado, 1024x1024. Guárdelos en outputs/grid-1.png a través de grid-3.png e incrústelos en la sección album-grid de index.html.
Aquí es donde la orquestación se gana la vida. Claude escribió las indicaciones basándose en el resumen, llamado Higgsfield tres veces (6 créditos en total), guardó los archivos, luego abrió el HTML y actualizó los atributos src de <img> para apuntar a los nuevos archivos. El tiempo total desde "construir la sección" hasta "la sección se renderiza con imágenes reales incrustadas" fue de menos de tres minutos. Lo vi suceder en la salida del terminal y no toqué el teclado.
La página no tenía píxeles perfectos. El punto de interrupción móvil necesitaba un ajuste. Una de las portadas del álbum tenía una mano dibujada un poco mal. El espacio entre héroes era un poco ajustado. Pero existió y recorrí el ochenta por ciento del camino en una sola sesión. A modo de comparación, pasé cinco horas haciendo maquetas de páginas de destino en Figma para conseguir el mismo ochenta por ciento. Los veinte restantes son artesanales. Los primeros ochenta son ahora una llamada de función.
Agregar el video del héroe animado enganchado para desplazarse
La tercera pieza es la que convirtió esto de "ordenado" a "Mantendré esta pila permanentemente". Quería un vídeo en bucle de cinco segundos en la parte superior del héroe (un movimiento lento de la cámara sobre un disco de vinilo girando) que se reprodujera en desplazamiento. El tipo de tratamiento por el que una auténtica agencia de diseño cobra tres mil dólares.
Le pedí a Claude que generara el video a través de Higgsfield usando Kling 3.06:
Genere un video en bucle de 5 segundos usando Kling 3.06: una cámara cinematográfica lenta se mueve a través de un disco de vinilo negro que gira en un tocadiscos, una iluminación suave y cálida, partículas de polvo en el aire, termina en una posición que regresa limpiamente al inicio. Guardar en salidas/hero-loop.mp4.
Este costó créditos reales. Un vídeo de cinco segundos sobre Kling 3.06 con calidad estándar se sitúa en el rango de 35 a 45 créditos. El mío llegó a 42 créditos. El render duró unos dos minutos y cuarenta segundos.
El resultado fue genuinamente cinematográfico. Tiro de enfoque suave al principio. Un lento avance a lo largo del disco. Iluminación cálida desde un ángulo de 45 grados. Pequeñas motas de polvo que captan la luz. Hizo un bucle limpio porque el mensaje así lo solicitó. He pagado a camarógrafos para que graben imágenes de productos menos convincentes que esta.
Luego Claude lo conectó a la página. El agente escribió la lógica de reproducción activada por desplazamiento: un pequeño IntersectionObserver que pausa el video cuando el héroe está fuera de la vista y lo reproduce cuando está a la vista, además de un desplazamiento de paralaje que aumenta ligeramente la escala del video a medida que el usuario se desplaza. Unas cuarenta líneas de JavaScript. Insertado en el index.html existente. Sin marcos, sin bibliotecas más allá de DOM API simples. Funcionó la primera vez.
Ese momento es cuando el término “sistema operativo de contenidos” dejó de ser lenguaje de marketing para mí. El agente trataba la generación de imágenes, la generación de videos, el diseño web y la animación JavaScript como verbos diferentes en la misma oración. Nunca antes había tenido una sola herramienta que hiciera eso. No flujo web. No Framer. No WordPress con veinte complementos. El agente siguió construyendo.
Avatares de personajes: entrenamiento de identificación del alma a partir de cinco fotos
La última pieza que probé fue la creación de personajes. Soul ID de Higgsfield es el modelo que le permite entrenar una identidad digital a partir de un pequeño conjunto de fotografías y luego mantener esa identidad bloqueada para cada generación futura. El caso de uso en el vídeo fueron avatares personales para contenido. El caso de uso que me importaba era algo más limitado: quería un personaje ficticio consistente que pudiera reutilizar en múltiples páginas de destino y creatividades publicitarias sin que fuera yo o una persona real.
Subí cinco fotos de un modelo original de una licencia que tenía (pagué, usé con permiso) y ejecuté la capacitación Soul ID:
Entrene a un personaje de Soul ID llamado "Eli" usando las fotos en las entradas/eli-references/. Después de completar el entrenamiento, genere un retrato de héroe de Eli con vestimenta informal de negocios, iluminación suave de estudio, contra un fondo gris neutro, 1024x1024.
El entrenamiento de Soul ID en Higgsfield normalmente espera más de 20 fotografías de referencia para lograr la máxima fidelidad, pero funciona en conjuntos más pequeños con menor consistencia. Cinco fotos me dieron un entrenamiento útil pero con cierta desviación en los ángulos laterales. Doce fotografías en una segunda prueba produjeron una consistencia notablemente mejor. El entrenamiento en sí tomó unos cinco minutos y costó aproximadamente 40 créditos: Higgsfield valora la creación de personajes de Soul ID como un costo único por personaje, no por generación.
Después del entrenamiento, cada generación de Eli cerró la cara. Podría poner a Eli en una cafetería, en una configuración de codificación, en un anuncio cinematográfico, contra una pared verde, en tres condiciones de iluminación diferentes, y la identidad se mantendría. Esa es la parte que realmente me sorprendió. He usado modelos de personajes personalizados antes y la consistencia siempre se degrada después de unas veinte generaciones. Identificación del alma mantenida hasta los cincuenta.
Para un operador multimarca como yo, se trata de un superpoder silencioso. Ahora tengo tres personajes de Soul ID entrenados que roto en diferentes líneas de contenido. Cada uno tiene una "persona" definida: qué visten, en qué tipo de ambientes se presentan, el ambiente de su iluminación. Ninguno de ellos es gente real. Ninguno de ellos soy yo. Todos ellos me dan la consistencia que me darían los modelos humanos sin la complejidad de las licencias, la programación o el ritmo continuo.
Aquí hay una línea ética seria que quiero nombrar explícitamente: no entrenar Soul ID en fotografías de personas reales sin su consentimiento explícito. Sólo porque la tecnología te lo permita no significa que esté bien. Utilice material de archivo con las licencias adecuadas, sus propias fotografías o modelos pagos que hayan autorizado el uso de AI. La herramienta es demasiado poderosa para ser descuidada.
La matemática real del precio: lo que realmente se compran con 1000 créditos Higgsfield
Tiempo para la parte que nadie cuantifica adecuadamente. Quemé 387 créditos durante esta sesión. Aquí está el desglose:
-
Generación de imágenes (Nano Banana 2, múltiples iteraciones): Aproximadamente 60 créditos entre el héroe Ghibli, las portadas del álbum y un puñado de indicaciones de prueba. A 2 créditos por iteración, es decir, 30 iteraciones en total. - Generación de video (Kling 3.06, bucle de 5 segundos): 42 créditos para un portero. Tuve que regenerar una vez porque la primera versión no se reproducía correctamente, por lo que el costo real fue de 84 créditos para conseguir un clip utilizable. - Entrenamiento de personaje de Soul ID: 40 créditos para el entrenamiento de Eli, luego otros 40 para un segundo personaje. - Generación de personajes de Soul ID (Eli, 12 generaciones a lo largo de la sesión): Aproximadamente 20 créditos a 1,5 o 2 créditos por salida. - Representación de páginas, operaciones de archivos, generación HTML/CSS: Cero créditos Higgsfield; eso es todo Claude Code, facturado contra mi suscripción Claude.
-
Experimentos de imágenes varias y repeticiones: Aproximadamente 100 créditos en varias pruebas que no he detallado.
Entonces, 387 créditos me dieron una página de inicio animada funcional, dos avatares de personajes entrenados, un video de héroe en bucle de cinco segundos y tres habilidades reutilizables. Según la estructura de precios actual de Higgsfield, donde un dólar compra aproximadamente 16 créditos, esa sesión me costó alrededor de $24 en créditos.
Los planes que envían esos créditos se ven así en el precio de Higgsfield para 2026:
- Nivel gratuito: 150 créditos por mes. Suficiente para realizar dos o tres pequeños experimentos. Útil para patear los neumáticos.
- Plan inicial: $15 por mes por la tarifa anual, 200 créditos mensuales. El objetivo de este nivel es "Quiero ejecutar flujos de trabajo reales de vez en cuando": una sesión completa de la página de destino por mes con créditos de sobra.
- Nivel medio: Alrededor de $39 por mes a la tarifa mensual más alta, los créditos aumentan aproximadamente entre 5 y 6 veces. El nivel correcto si ejecuta esta pila semanalmente o para trabajo con clientes.
- Niveles más altos (Starter Plus, Ultra): Hasta aproximadamente $84 por mes para uso intensivo de producción con asignaciones de crédito dimensionadas para la producción de contenido diario.
Las matemáticas que importan para la mayoría de los lectores: si prueba esto una o dos veces, el nivel gratuito es suficiente. Si lo ejecuta mensualmente como parte de su flujo de trabajo, Starter a $15 es suficiente. Si está utilizando esto para administrar una pequeña empresa de contenido en varias marcas como lo hago yo, el nivel medio es donde reside.
Hay un costo que la mayoría de la gente olvida. Claude Code se ejecuta con una suscripción paga Claude. No puede ejecutar nada de esto en el nivel gratuito de Claude. Mi uso allí promedia otros $20 de costos API por mes además de los créditos Higgsfield, y Anthropic ofrece un plan Pro Claude de $20/month más niveles más altos para usuarios habituales. Incluya eso en el presupuesto.
Habilidades que guardé de esta sesión y que puedes robar
El patrón al que sigo volviendo: el valor no está en una sesión, sino en las habilidades reutilizables que produjo la sesión. Al final de la compilación, tenía tres habilidades en ~/.claude/skills/ que usaré semanalmente. El generador de héroes de Ghibli ya os lo enseñé. Los otros dos:
Sección de héroe de producto animada. Una habilidad que, dada una descripción general del producto, genera una imagen de héroe, un video en bucle de cinco segundos y un bloque de héroe HTML/CSS completo y responsivo con el video conectado a una reproducción activada por desplazamiento. Aproximadamente cincuenta líneas de habilidad.md. Costo por ejecución: alrededor de 50 créditos Higgsfield más unos cientos de tokens Claude. Reemplaza lo que solía ser un flujo de trabajo de seis horas con múltiples herramientas.
Generador de personajes consistente con la marca. Una habilidad que toma un ID de personaje Soul ID y un resumen de la escena, luego genera una imagen de personaje consistente en múltiples relaciones de aspecto: cuadrado, 4:5 para Instagram, 9:16 para historias, 16:9 para YouTube. Alrededor de treinta y cinco líneas de habilidad.md. Costo por ejecución: alrededor de 6 a 10 créditos Higgsfield dependiendo de cuántas tallas solicite el informe.
La razón por la que sigo insistiendo en las habilidades: cada vez que guardo un flujo de trabajo como una habilidad, recupero tiempo en cada ejecución futura. La primera carrera es exploratoria y requiere atención total. La centésima carrera es una línea. Si a esto le sumamos más de un año de contenido multimarca, el apalancamiento se vuelve estúpido rápidamente. Escribí una versión más extensa de esto en la guía avanzada de habilidades del agente si quieres el modelo mental completo.
Dónde se desmorona esta pila (y qué hacer al respecto)
Quiero terminar con la crítica honesta porque soy escéptico ante cualquier tutorial que termine con "y todo funcionó perfectamente". Esta pila tiene límites reales.
El agente toma decisiones de diseño que usted no tomaría. Cuando dejo que Claude elija su propia tipografía, contraste de color o composición de imagen sin una especificación de marca clara, el resultado se desvía hacia una estética de startup tecnológica genérica. La solución es escribir un archivo de rebajas de especificaciones de marca una vez e incorporarlo a todas las habilidades relevantes. Sin esa especificación, obtendrá el promedio de cada página de destino que Claude haya visto.
La generación de vídeo sigue siendo lenta y costosa. Cinco segundos de Kling 3.06 equivalen a dos minutos y medio de tiempo de renderizado y 42 créditos por encargado. Veinte segundos es aproximadamente cuatro veces más. Si necesita un video de marca de un minuto, esta pila no es el lugar donde lo construye, sino que une clips más cortos. Cualquier cosa que dure más de diez segundos rompe la economía unitaria por ahora.
La coherencia de Soul ID se degrada con muy pocas fotografías de referencia. Cinco fotografías funcionan para uso ocasional. Para el trabajo con clientes, entrena con más de 20 imágenes en diferentes ángulos e iluminación o tu personaje irá a la deriva en la larga cola de generaciones.
Las herramientas MCP aún están madurando. Encontré un error en el que Higgsfield MCP devolvió un ID de trabajo antes de que el archivo terminara de escribirse en el disco, y el siguiente paso de mi cadena intentó leer un archivo que aún no existía. Claude finalmente lo volvió a intentar y se recuperó. Un flujo de trabajo más ingenuo habría fracasado. Incorpore reintentos a sus habilidades.
Permisos arrastrados. Ejecutar con --dangerously-skip-permissions significa que el agente puede escribir en cualquier lugar al que tenga acceso. Mantengo esta pila en un directorio temporal protegido y copio manualmente los resultados terminados en carpetas de proyectos reales. La disciplina importa.
La rotación de modelos no se detiene solo porque MCP existe. La abstracción MCP hace que el intercambio de modelos sea barato. Esto no hace que elegir el modelo correcto sea trivial. Aún debes saber que Nano Banana 2 es excelente para imágenes estilizadas pero más débil para humanos fotorrealistas, o que Kling 3.06 maneja los movimientos de la cámara cinematográfica mejor que Veo 3.1 para el movimiento del producto. El MCP es el cableado. El gusto sigue siendo el trabajo.
Lo que veré a continuación
Tres cosas a las que prestaré atención durante el próximo trimestre.
Veo 3.1 versus Sora 2 para video del producto. Ambos se enviaron este año. Se puede acceder a ambos a través de MCP de Higgsfield. Ambos son excelentes. Todavía no he realizado un enfrentamiento directo con el mismo mensaje y la misma marca. Esa es la siguiente prueba en esta pila, y el resultado probablemente cambiará el modelo predeterminado de mi habilidad de "héroe animado".
Antigravity, el IDE de Anthropic. Antigravity incluye soporte MCP de primera clase y está posicionado específicamente para el desarrollo impulsado por agentes. Si las habilidades de Higgsfield funcionan tan limpiamente allí como en Claude Code, la elección entre las dos se convierte en una preferencia de flujo de trabajo en lugar de una cuestión de capacidad. Cubrí el posicionamiento IDE antigravedad cuando se envió.
Mercados de habilidades. Ahora mismo escribo mis propios archivos Skill.md. El paquete de habilidades Higgsfield es uno de los primeros casos en los que un tercero envía habilidades de calidad de producción como un paquete. Si esto se convierte en un ecosistema real (descubrimiento al estilo npm, control de versiones, dependencias), la influencia sobre cada creador individual aumentará en otro orden de magnitud. Apostaría dinero a que esto sucederá antes de finales de 2026.
El resumen de una línea si sólo recuerdas una cosa: el valor de un sistema operativo de contenidos no está en un único modelo. Es en el cableado donde los modelos son reemplazables, los flujos de trabajo reutilizables y el agente es capaz de tratar "imagen", "vídeo", "página" y "animación" como verbos en la misma oración. MCP de Higgsfield es el cableado. Claude Code es el agente. Las habilidades son los flujos de trabajo. Codex es el segundo par de manos. Ninguna de esas piezas es nueva esta semana. Lo nuevo es que por fin componen sin pelearse entre ellos.
Qué hacer en la próxima hora
Si ha leído hasta aquí, esto es lo más pequeño que puede hacer esta noche y que tendrá importancia dentro de seis meses.
Instale Higgsfield MCP en Claude Code. Ejecute una generación de imágenes a través de Nano Banana 2. Guarde el mensaje como un archivo Skill.md. Eso es todo. Tres pasos. Aproximadamente diez minutos. El nivel gratuito lo cubre todo.
La razón por la que esto es importante es la misma por la que todo flujo de trabajo aprovechado es importante: el costo inicial es pequeño y el costo de espera es elevado. Dentro de seis meses tendrás una biblioteca de habilidades que has perfeccionado a lo largo de docenas de carreras o estarás donde estás esta noche. La primera carrera es la única que requiere coraje. Cada ejecución posterior es una llamada de función.
Voy a volver a la terminal. Hay una imagen principal para la próxima publicación colorpark.io que debe existir por la mañana, y la habilidad Ghibli está exactamente a dos palabras de representarla.
Preguntas frecuentes
¿Necesito Codex y Claude Code para ejecutar esta pila?
No: Claude Code por sí solo es suficiente para ejecutar el flujo de trabajo completo de Higgsfield MCP. Ejecuto Codex CLI en paralelo porque me gusta tener un segundo tiempo de ejecución para iterar en la copia mientras Claude se procesa, pero cada paso de esta compilación se puede realizar en Claude Code por sí solo. Para conocer el razonamiento del agente dual, consulte el desglose del flujo de trabajo Codex y Claude Code más arriba.
¿Cuánto cuesta realmente el sistema operativo de contenido completo al mes?
Planifique entre $15 y $39 por mes para créditos Higgsfield según el volumen de uso, más una suscripción Claude de $20+. Los grandes creadores que ejecutan contenido diario obtienen cerca de $ 84 por mes en Higgsfield. El desglose completo se encuentra en la sección de matemáticas de precios anterior.
¿Los créditos de mi plan Higgsfield existente funcionarán a través de MCP?
Sí. La autenticación se ejecuta a través de su cuenta Higgsfield existente y los créditos del plan existente se transfieren a MCP sin ningún cambio. No existe un grupo de "créditos MCP" separado: es una billetera compartida entre la aplicación web, CLI y MCP.
¿Qué sucede con mi flujo de trabajo cuando Higgsfield agrega nuevos modelos?
Nada: ese es el objetivo de la abstracción MCP. Los nuevos modelos se registran en el lado de Higgsfield y se pueden llamar mediante los mismos comandos MCP. Cambia una cadena de nombre de modelo en su Skill.md si desea cambiar a uno más nuevo y su canalización existente continúa ejecutándose sin cambios.
¿Alguien que no sea codificador puede realmente ejecutar esta pila?
Principalmente sí para la instalación y las indicaciones, con una honesta advertencia: la depuración cuando el agente hace algo inesperado requiere una lectura cómoda de la salida del terminal. La instalación consta de tres comandos. Las indicaciones están en inglés sencillo. Las habilidades son archivos de rebajas. Pero cuando MCP devuelve un error o una habilidad se comporta mal, debes estar dispuesto a leer lo que te dice el terminal. Si eso está bien, el resto es accesible.
Trabajemos juntos
¿Quiere crear sistemas AI, automatizar flujos de trabajo o ampliar su infraestructura tecnológica? Me encantaría ayudar.
- Fiverr (compilaciones e integraciones personalizadas): fiverr.com/s/EgxYmWD
- Cartera: mejba.me
- Ramlit Limited (soluciones empresariales): ramlit.com
- ColorPark (diseño y marca): colorpark.io
- xCyberSecurity (servicios de seguridad): xcybersecurity.io