Skip to main content
📝 Claude Code

Content Operating System: Claude Code + Higgsfield + Codex

Ich habe ein Content-Betriebssystem mit Claude Code, Higgsfield 2 MCP und Codex erstellt – Websites, Videos, Bilder, Audio von einem CLI. Echte Kosten, echter

27 min

Lesezeit

5,355

Wörter

May 08, 2026

Veröffentlicht

Engr Mejba Ahmed

Geschrieben von

Engr Mejba Ahmed

Artikel teilen

Content Operating System: Claude Code + Higgsfield + Codex

Inhalt Betriebssystem: Claude Code + Higgsfield + Codex

Die Benachrichtigung traf an einem Sonntag um 23:09 Uhr ein. Ein Ersteller, dem ich folge, hatte ein Tutorial mit dem Titel „Build a Whole Content OS with Claude, Higgsfield 2 und Codex“ gepostet. Um Mitternacht hatte ich das Video auf einem zweiten Monitor geöffnet, mein Terminal auf dem ersten und ein neuer Projektordner namens content-os-test wartete auf den ersten Befehl. Der Pitch war einfach genug, um misstrauisch zu sein: ein CLI, ein Eingabeaufforderungsfenster, am anderen Ende kamen Websites, Bilder, Videos, Audio und animierte Avatare heraus. Ich habe der Demo nicht geglaubt. Ich musste es ausführen.

Was ich jetzt durchgehen werde, ist keine Zusammenfassung dieses Videos. Es ist das Build-Protokoll meiner eigenen Version, das innerhalb des eigentlichen Stacks ausgeführt wird, den ich jeden Tag verwende – Claude Code als Gehirn, Higgsfield 2s neuer MCP für visuelle Elemente, Codex diese Pipelines als einen einzigen Befehl. Ich mache seit Jahren Multi-Marken-Inhalte für mejba.me, ramlit.com, colorpark.io und xcybersecurity.io, daher bin ich mit klarem Blick darauf eingegangen, was real und was Demo-Magie ist.

Am Ende einer Sitzung hatte ich eine funktionierende animierte Zielseite, ein mit Nano Banana 2 generiertes 16:9-Heldenbild, ein durch Scrollen ausgelöstes fünf Sekunden langes Heldenvideo, einen benutzerdefinierten Avatar, der anhand einer Handvoll hochgeladener Fotos trainiert wurde, und drei wiederverwendbare Fähigkeiten in ~/.claude/skills/, die ich aus jedem zukünftigen Projekt heraus starten kann. Der Kreditzähler endete bei 387 ausgebrannten von 1.000 in meinem Rucksack. Günstiger als eine einzelne freiberufliche Stunde. Mehr als eine Woche Kontextwechsel zwischen fünf verschiedenen Apps lohnt sich.

Lassen Sie mich Ihnen genau zeigen, wie es dazu kam – und wo der Begriff „Content-Betriebssystem“ tatsächlich eine Bedeutung hat und kein Schlagwort ist.

Was ein Content-Betriebssystem im Jahr 2026 eigentlich ist

Ich möchte diesbezüglich ehrlich sein, da der Ausdruck derzeit in YouTube auf fünf verschiedene Arten verwendet wird. Ein Content-Betriebssystem ist kein einzelnes Produkt, das Sie kaufen können. Im App Store gibt es keine App namens „Content OS“. Wer Ihnen eines verkauft, verkauft Ihnen eine Verpackung.

Was es im Jahr 2026 tatsächlich ist: ein zusammengefügter Stapel, in dem eine Agentenlaufzeit Ihren Kontext speichert, mehrere Generations-Engines über ein Standardprotokoll daran angeschlossen werden und wiederverwendbare Workflows sich wiederholende Aufgaben in einzeilige Befehle umwandeln. In meinem Setup sehen die Teile so aus:

  • Claude Code ist der Orchestrator. Es speichert den Markenkontext, wählt aus, welches Modell für welchen Job aufgerufen werden soll, schreibt HTML und CSS, speichert Dateien an den richtigen Stellen und verkettet Schritte miteinander, ohne dass ich etwas anklicken muss. - Higgsfield 2 MCP ist die kreative Engine. Es stellt mehr als dreißig Bild- und Videomodelle – Nano Banana 2, Soul 2.0, Sora 2, Veo 3.1, Kling 3.0, Seedance 2.0, Flux 2, Wan 2.7, MiniMax Hailuo 02 – über einen Model Context Protocol-Server zur Verfügung. Laut Higgsfields eigener MCP-Seite wurde der Server offiziell am 30. April 2026 ausgeliefert. - **Codex

Der Codierungsagent von Ich habe darüber geschrieben, warum ich Codex und Claude Code als Dual-Agent-Setup ausführe, anstatt einen auszuwählen. - Skills (skill.md-Dateien) sind die Workflows. Bei jeder davon handelt es sich um eine kleine Markdown-Datei, die dem Agenten beibringt, wie er eine bestimmte Pipeline ausführt – „ein Heldenbild im Ghibli-Stil erstellen“, „eine Produkt-Landingpage erstellen“, „ein fünf Sekunden langes Scroll-Loop-Video rendern“. Sobald eine Fertigkeit vorhanden ist, muss ich diesen Arbeitsablauf nie wieder erklären.

Das ist der ganze Stapel. Beachten Sie, was fehlt: kein Figma, kein Photoshop, kein Premiere, kein DaVinci, kein separater Website-Builder, kein Runway-Tab, kein Midjourney Discord, kein ElevenLabs-Dashboard, kein Adobe irgendetwas. Jedes Modell, das ich benötige, ist von einem Terminal aus erreichbar, da Higgsfield sie aggregiert und MCP sie als Befehle verfügbar macht.

Der Grund dafür ist einer, auf den ich immer wieder zurückkomme: Die Modellabwanderung von AI ist brutal. Vor sechs Monaten existierte keines der gerade aufgeführten Modelle in seiner jetzigen Form. Nano Banana 2 wurde im Februar 2026 ausgeliefert. Sora 2 ersetzte Sora 1. Kling sprang von 2 auf 3,0 auf 3,06. Die Seedance wurde von 1,5 auf 2,0 verschoben. Veo stieg von 3 auf 3.1. Wenn Sie Ihren Workflow direkt um ein Modell herum aufbauen, verbringen Sie die Hälfte Ihrer Zeit damit, es neu zu verkabeln. Wenn Sie es um einen MCP herum aufbauen, der die Modelle abstrahiert, tauschen Sie einen String aus und arbeiten weiter.

Warum MCP die Mathematik bei Multi-Modell-Workflows ändert

Bevor ich durch die Installation gehe, eine kurze Seitenleiste dazu, warum das Model Context Protocol hier besonders wichtig ist. Dies ist der Teil, der in den meisten Tutorials beschönigt wird und der den gesamten Stapel zukunftssicher macht.

MCP, ursprünglich Ende 2024 von Anthropic veröffentlicht, ist eine standardisierte Möglichkeit für AI-Agenten, mit externen Tools zu kommunizieren. Anstatt dass jedes Tool seine eigene maßgeschneiderte Integration erstellt, stellt sich das Tool einmal als MCP-Server zur Verfügung. Jeder Agent, der MCP spricht – Claude Code, Codex, Cursor, Anthropics eigene Antigravity-IDE – kann es dann ohne benutzerdefinierte Verkabelung verwenden.

Als Higgsfield seinen MCP-Server auslieferte, bewirkte dieser eine Schritt etwas ganz stilles Wichtiges: Er machte jedes Modell auf Ich installiere den MCP einmal. Claude Code kann Nano Banana 2 aufrufen. Das gilt auch für Codex. Dies gilt auch für jede zukünftige Agentenlaufzeit, die existiert. Wenn Higgsfield nächsten Monat Veo 4 hinzufügt, ändere ich meinen Code nicht. Der MCP macht es sichtbar und meine vorhandenen Fähigkeiten greifen es auf.

Aus diesem Grund wette ich nicht mehr auf einzelne Modelle des Typs APIs. Ich habe Anfang 2025 einen Workflow direkt auf dem Runway Gen-3 API aufbauen lassen. Als Runway Gen-4 mit einem anderen Schema auslieferte, habe ich alles neu geschrieben. Dann musste ich noch einmal umschreiben, als ich die Kling-Ausgabe vergleichen wollte. Dann noch einmal für Veo. Der CLI/MCP-Ansatz beendet die gesamte Schleife. MCP von Higgsfield ist die Abstraktionsschicht, auf die ich die ganze Zeit hätte aufbauen sollen.

Die Installation: Higgsfield MCP Innerhalb von Claude Code

Die Installation ist wirklich einfach, was in dieser Kategorie selten ist. Die MCP-Seite von Higgsfield listet drei Varianten auf: MCP für Claude Code, CLI für jeden Agenten und ein Skills-Paket. Ich bin mit allen dreien gegangen.

Schritt eins: Installieren Sie den MCP in Claude Code. Von jedem Terminal aus:

claude mcp add higgsfield -- npx -y @higgsfield/mcp-server

Dadurch wird Higgsfield als MCP-Server zur Konfiguration von Claude Code hinzugefügt und das Serverpaket von npm abgerufen. Wenn Sie zum ersten Mal ein Higgsfield-Tool aufrufen, führt es einen OAuth-Flow in Ihrem Browser aus und bindet Ihr vorhandenes Higgsfield-Konto. Keine API-Schlüssel zum Kopieren und Einfügen. Wenn Sie bereits einen Higgsfield-Plan haben, werden Ihre Credits automatisch übertragen.

Schritt zwei: Installieren Sie das offizielle Skill-Bundle. Dieser Teil stellt dem Agenten vorgefertigte Arbeitsabläufe für Produktfotoshootings, Marketingvideos, Charaktertraining und Bildgenerierung zur Verfügung:

npx skills@higgsfield/ai-skills

Das interaktive Installationsprogramm stellt drei Fragen: Installationsbereich (ich habe global ausgewählt), welche Fähigkeiten aktiviert werden sollen (ich habe higgsfield-generate, higgsfield-product-photoshoot und higgsfield-soul-id gewählt) und an welchen Agenten gebunden werden soll (Claude Code). Die gesamte Installationszeit betrug etwa neunzig Sekunden, wovon der größte Teil auf das Abrufen von Abhängigkeiten durch npm entfiel.

Schritt drei (optional, aber ich mache es): Wiederholen Sie die MCP-Installation für Codex. Der Grund sind Parallelläufe. Wenn Claude ein Video rendert, das vier Minuten dauert, möchte ich mit dem Kopieren in Codex fortfahren, ohne zu warten. Codex hat seine eigene MCP-Unterstützung und das gleiche mcp add-Muster funktioniert dort mit einem anderen Konfigurationsflag. Der ~/.codex/config.toml befindet sich an einem anderen Ort, aber die Verkabelung ist identisch.

Nach der Installation habe ich Claude Code gestartet und /skills ausgeführt, um die Registrierung zu bestätigen. Es wurden drei neue Einträge angezeigt: higgsfield-generate, higgsfield-product-photoshoot und higgsfield-soul-id. Plus Dienstprogrammbefehle für Guthaben, Auftragsstatus und Anlagenliste. Der CLI war live.

Ein kurzer Realitätscheck zu Berechtigungen. Bei den Higgsfield-Fähigkeiten wird davon ausgegangen, dass der Agent Dateien auf die Festplatte schreiben kann, ohne für jeden Vorgang eine Erlaubnis einzuholen. Ich führe diese Pipeline mit claude --dangerously-skip-permissions in einem Scratch-Projektordner aus. Nicht in meinem Hauptmonorepo. Nirgendwo kann ich es nicht in fünf Minuten von Grund auf neu aufbauen. Wenn Sie nervös sind, führen Sie es in einem neuen Ordner aus, den Sie anschließend verwenden können. Die Flagge ist in Ordnung, wenn der Explosionsradius begrenzt ist. Es ist gefährlich, wenn es nicht so ist.

Erster Test: Generieren eines 16:9-Heldenbilds im Ghibli-Stil mit Nano Banana 2

Ich habe den gleichen Test ausgewählt, den das ursprüngliche Tutorial verwendet hat: ein 16:9-Bild im Studio Ghibli-Stil von drei englischen Springer Spaniels. Spezifisch genug, um eine eindeutig richtige Antwort zu haben. Stilistisch genug, dass ein generisches Modell Brei hervorbringen würde und ein gutes Modell etwas Charmantes hervorbringen würde.

Ich habe in Claude Folgendes eingegeben:

Erstellen Sie ein 16:9-Bild im Ghibli-Stil von drei English Springer Spaniels, die zur goldenen Stunde durch eine Wildblumenwiese laufen. Verwenden Sie Nano Banana 2. Speichern Sie es in den Ausgängen/hero-spaniels-v1.png.

Claude leitete das über Higgsfield MCP, wählte aufgrund meiner prompten Erwähnung das Nano Banana 2-Modell mit der Größe 16:9 aus und führte den Job aus. Der Credit-Hit lag bei 2 Credits pro Iteration bei der Standard-2K-Auflösung – Nano Banana 2 ist derzeit eines der günstigsten Modelle im Higgsfield-Katalog. Ich habe um vier Iterationen gebeten, die mich insgesamt 8 Credits gekostet haben. Fünfundvierzig Sekunden später hatte ich vier Dateien in outputs/.

Der erste war wirklich umwerfend. Sanfte, von Ghibli gemalte Striche, drei deutlich gezeichnete Hunde, Tiefe in der Wiese, die Art von goldenem Stundenlicht, um das herum Studio Ghibli ganze Filme baut. Beim zweiten Bild versteckte sich im Hintergrund ein vierter Hund, den ich entweder als Käfer oder als Charakter betrachten konnte. Der dritte war etwas matschig. Der vierte war der Torwart.

Das ist der Teil, den die Leute übersehen, wenn sie über generative AI-Kosten nachdenken. Die wirtschaftliche Einheit ist nicht „ein Bild“ – sie ist „ein Bewahrer aus N“. Für Nano Banana 2 mit 2 Credits pro Iteration zahlte ich umgerechnet etwa dreizehn Cent pro Iteration und etwa zweiundfünfzig Cent für den Keeper. Für ein Heldenbild, das gut genug ist, um auf einer echten Landingpage zu erscheinen, sind 52 Cent die Art von Zahl, die stillschweigend die Budgets herkömmlicher Stockfoto-Budgets sprengt.

Ich habe bereits darüber geschrieben, wie man über die Kostenberechnung dieser Tools nachdenkt (https://www.mejba.me/ai-agent-cost-optimization-guide), und die Kurzfassung lautet: Der Modellpreis pro Iteration ist weniger wichtig als die Anzahl der Iterationen, die Sie benötigen, um einen Keeper zu gewinnen. Günstige Modelle, die acht Landeversuche benötigen, sind teurer als Modelle der Mittelklasse, die zwei landen. Nano Banana 2 landet bei den meisten Eingabeaufforderungen in ein oder zwei. Das ist der Wert.

Die Skill-Datei, die dies wiederholbar macht

Hier ist der Teil, auf den das Originalvideo deutet, den er aber nicht zeigt. Der Sinn der einmaligen Ausführung dieser Pipeline besteht darin, sie nie zweimal auf die gleiche Weise auszuführen – jeder Workflow wird als skill.md gespeichert, sodass die nächste Ausführung ein einzeiliger Befehl ist.

Ich habe die Ghibli-Heldenpipeline als Fertigkeit bei ~/.claude/skills/ghibli-hero-image/skill.md gespeichert. Die Datei sieht so aus:

---
name: ghibli-hero-image
description: Generate a Ghibli-style hero image at 16:9 using Nano Banana 2 through Higgsfield MCP. Use when the user asks for a soft, painted, animated-film-style hero or banner.
---

When invoked, do the following:

1. Ask the user for the subject of the image (one sentence is enough).
2. Construct a Higgsfield prompt with these locked elements:
   - Style: "Studio Ghibli, soft painted strokes, hand-drawn animation aesthetic"
   - Lighting: "golden hour, warm directional light"
   - Composition: "16:9, cinematic depth, foreground subject + meadow or natural backdrop"
3. Call higgsfield-generate with model = nano-banana-2, aspect = 16:9, iterations = 4.
4. Save outputs to ./outputs/ with filenames hero-{subject-slug}-v1.png through v4.png.
5. Print a summary table: filename, credit cost, prompt used, recommended pick (the agent's best guess at the keeper).

Cost expectation: 8 credits for 4 iterations on Nano Banana 2. Total runtime ~45 seconds.

Avoid: photorealism, hard digital edges, flat color blocks. Reject any output that looks 3D-rendered.

Die gesamte Datei umfasst ungefähr dreißig Zeilen. Sobald es auf der Festplatte ist, ist jeder zukünftige Ghibli-Held ein Befehl. Ich gebe „Use the ghibli-hero-image skills for [subject]“ in Claude ein und der Agent führt die gesamte Pipeline aus, schreibt Ausgaben und teilt mir mit, welche davon seiner Meinung nach der Bewahrer ist. Wenn ich das nächste Mal ein Heldenbild für einen colorpark.io-Blogbeitrag möchte, ist das die gesamte Interaktion.

Das ist die Freischaltung. Die Models werden weiter wechseln. Pipelines sollten nicht. Jeder wiederverwendbare Workflow, den Sie als Skill speichern, ist ein Workflow, an den Sie sich im nächsten Monat nicht erinnern müssen. Ich habe darüber geschrieben, wie das Agenten-Skills-System dieses gesamte Muster umgestaltet, und Skill.md-Dateien sind das Dateiformat mit der höchsten Ausnutzung, das ich im letzten Jahr verwendet habe.

Erstellen der Website: Inspiration für ein Designsystem im Spotify-Stil

Der nächste Test war der schwierigere. Das Video zeigte, wie Jack Claude als Inspiration mit einem echten GitHub-Designsystem-Repo fütterte und ihn aufforderte, eine Landingpage in diesem Stil zu erstellen. Ich wollte das weiter vorantreiben. Ich wählte die Designsprache von Spotify als Referenz – die dunklen Hintergründe, der grüne Akzent, die klobige Anzeigeart, die Sensibilität des Album-Cover-Rasters – und bat Claude, eine fiktive Produkteinführungsseite in dieser Atmosphäre zu entwerfen.

Die Eingabeaufforderung, die ich verwendet habe:

Erstellen Sie eine einseitige Landingpage für ein fiktives Produkt namens „Vinyl Memory“ – ein Dienst, der Ihren Spotify-Hörverlauf in eine individuelle Schallplatte umwandelt. Designsprache: Spotifys Website, aber dunkler und hochwertiger. Verwenden Sie echte Typografie im Spotify-Stil (Spotify Mix oder Inter als Alternative), das Farbsystem Grün auf fast Schwarz, großzügige Leerräume und Albumcover-Rasterabschnitte. Geben Sie eine einzelne index.html mit eingebettetem CSS aus.

Claude erzeugte im ersten Durchgang etwa 380 Zeilen HTML und CSS. Die Struktur stimmte – Held mit dem Produktmodell, drei Funktionsblöcken, einer „Funktionsweise“-Zeitleiste, einem Albumrasterabschnitt mit Beispieldatensätzen, einem E-Mail-Anmelde-CTA, einer Fußzeile. Die Farben waren nah beieinander. Die Typografie nutzte Inter als Ausweichlösung, da der Agent Spotify Mix nicht von einem zuverlässigen Ort beziehen konnte, was in Ordnung ist – Inter ist ein guter Ersatz.

Beim zweiten Durchgang wurde es interessant. Ich habe Claude gebeten, mit Higgsfield drei Produktbilder für den Album-Raster-Bereich zu generieren. Die Aufforderung:

Erstellen Sie für das Albumraster drei Vinyl-Schallplattencover in Higgsfield mit Nano Banana 2. Jedes sollte einen anderen Hörer-Archetyp widerspiegeln – stimmungsvolle spätabendliche Stimmung, sommerliches Autofahren, konzentrierter Arbeitsmodus. Quadratisches Format, 1024x1024. Speichern Sie sie über „grid-3.png“ in „outputs/grid-1.png“ und betten Sie sie in den Abschnitt „album-grid“ von index.html ein.

Hier verdient die Orchestrierung ihren Lebensunterhalt. Claude schrieb die Eingabeaufforderungen selbst basierend auf dem Briefing mit dem Namen Higgsfield dreimal (insgesamt 6 Credits), speicherte die Dateien, öffnete dann den HTML-Code und aktualisierte die <img>-src-Attribute so, dass sie auf die neuen Dateien verweisen. Die Gesamtzeit vom Erstellen des Abschnitts bis zum Rendern des Abschnitts mit eingebetteten echten Bildern betrug weniger als drei Minuten. Ich habe es in der Terminalausgabe beobachtet und die Tastatur nicht berührt.

Die Seite war nicht pixelgenau. Der mobile Haltepunkt musste angepasst werden. Auf einem der Albumcover war die Hand leicht falsch gezeichnet. Der Heldenabstand war etwas eng. Aber es existierte und es wurden achtzig Prozent des Weges in einer einzigen Sitzung zurückgelegt. Zum Vergleich: Ich habe fünf Stunden mit Landingpage-Modellen in Figma verbracht, um die gleichen achtzig Prozent zu erreichen. Die restlichen zwanzig sind Handwerkskunst. Die ersten achtzig sind jetzt ein Funktionsaufruf.

Hinzufügen des animierten Heldenvideos Hooked to Scroll

Der dritte Teil ist derjenige, der dies von „ordentlich“ in „Ich behalte diesen Stapel dauerhaft“ verwandelte. Ich wollte ein fünf Sekunden langes Loop-Video am Anfang des Helden – eine langsame Kamerabewegung über eine sich drehende Schallplatte –, das beim Scrollen abgespielt wird. Die Art von Behandlung, für die eine echte Designagentur dreitausend Dollar verlangt.

Ich habe Claude gebeten, das Video über Higgsfield mit Kling 3.06 zu generieren:

Erstellen Sie mit Kling 3.06 ein 5-Sekunden-Looping-Video: Eine langsame filmische Kamerabewegung über eine schwarze Schallplatte, die sich auf einem Plattenspieler dreht, sanftes, warmes Licht, Staubpartikel in der Luft, endet in einer Position, die sauber zum Anfang zurückkehrt. Speichern in den Ausgängen/hero-loop.mp4.

Dieser kostete echte Credits. Ein fünf Sekunden langes Video zu Kling 3.06 in Standardqualität liegt im Bereich von 35 bis 45 Credits. Meiner hatte 42 Credits. Das Rendern dauerte etwa zwei Minuten und vierzig Sekunden.

Die Ausgabe war wirklich filmisch. Soft-Fokus-Zug zu Beginn. Ein langsames Dolly-In über die Platte. Warme Beleuchtung aus einem 45-Grad-Winkel. Winzige Staubkörnchen fangen das Licht ein. Es wurde eine saubere Schleife ausgeführt, da die Eingabeaufforderung dazu aufgefordert wurde. Ich habe Videofilmer dafür bezahlt, weniger überzeugendes Produktmaterial zu drehen.

Dann hat Claude es mit der Seite verbunden. Der Agent hat die durch Scrollen ausgelöste Wiedergabelogik selbst geschrieben – einen kleinen IntersectionObserver, der das Video anhält, wenn der Held außer Sichtweite ist, und es abspielt, wenn es im Sichtfeld ist, sowie einen Parallaxenversatz, der das Video beim Scrollen des Benutzers leicht vergrößert. Ungefähr vierzig Zeilen JavaScript. Eingefügt in den vorhandenen index.html. Keine Frameworks, keine Bibliotheken außer einfachen DOM APIs. Beim ersten Mal hat es funktioniert.

In diesem Moment hörte der Begriff „Content-Betriebssystem“ für mich auf, eine Marketingsprache zu sein. Der Agent behandelte Bildgenerierung, Videogenerierung, Weblayout und JavaScript-Animation als verschiedene Verben im selben Satz. Ich habe das noch nie mit einem einzigen Werkzeug gemacht. Nicht Webflow. Nicht Framer. Nicht WordPress mit zwanzig Plugins. Der Agent baute einfach weiter.

Charakter-Avatare: Training der Seelen-ID aus fünf Fotos

Das letzte Stück, das ich getestet habe, war die Charaktererstellung. Higgsfields Soul ID ist das Modell, mit dem Sie eine digitale Identität anhand einer kleinen Reihe von Fotos trainieren und diese Identität dann für alle zukünftigen Generationen geheim halten können. Der Anwendungsfall im Video waren persönliche Avatare für Inhalte. Der Anwendungsfall, der mir wichtig war, war etwas enger gefasst: Ich wollte eine konsistente fiktive Figur, die ich auf mehreren Zielseiten und Anzeigenmotiven wiederverwenden konnte, ohne dass es sich dabei um mich oder eine reale Person handelte.

Ich habe fünf Fotos eines Standardmodells aus einer Lizenz hochgeladen, die ich besaß (bezahlt, mit Genehmigung verwendet) und das Soul ID-Training durchgeführt:

Trainieren Sie einen Soul-ID-Charakter namens „Eli“ mithilfe der Fotos in den Eingaben/eli-references/.. Erstellen Sie nach Abschluss des Trainings ein Heldenporträt von Eli in Business-Freizeitkleidung, sanfter Studiobeleuchtung, vor einem neutralen grauen Hintergrund, 1024 x 1024.

Das Soul-ID-Training in Higgsfield erwartet normalerweise mehr als 20 Referenzfotos für höchste Wiedergabetreue, funktioniert aber bei kleineren Sets mit geringerer Konsistenz. Fünf Fotos zeigten mir ein brauchbares Training, allerdings mit etwas Drift in den Seitenwinkeln. Zwölf Fotos ergaben in einem zweiten Test eine spürbar bessere Konsistenz. Das Training selbst dauerte etwa fünf Minuten und kostete etwa 40 Credits – Higgsfield berechnet die Charaktererstellung von Soul ID als einmalige Kosten pro Charakter, nicht pro Generation.

Nach dem Training verschloss jede Eli-Generation das Gesicht. Ich konnte Eli in einem Café, in einem Coding-Setup, in einer filmischen Werbeaufnahme, vor einer grünen Wand, bei drei verschiedenen Lichtverhältnissen platzieren, und die Identität blieb erhalten. Das ist der Teil, der mich wirklich überrascht hat. Ich habe zuvor personalisierte Charaktermodelle verwendet und die Konsistenz ließ nach etwa zwanzig Generationen immer nach. Seelen-ID bis fünfzig gehalten.

Für einen Mehrmarkenbetreiber wie mich ist das eine stille Supermacht. Ich habe jetzt drei ausgebildete Soul ID-Charaktere, die ich über verschiedene Inhaltszeilen hinweg rotiere. Jeder hat eine definierte „Persönlichkeit“ – was er trägt, in welchen Umgebungen er auftritt, die Stimmung seiner Beleuchtung. Keiner von ihnen ist ein echter Mensch. Keiner von ihnen bin ich. Sie alle geben mir die Konsistenz, die mir menschliche Modelle ohne die Komplexität der Lizenzierung, der Zeitplanung oder der fortlaufenden Geschwindigkeit bieten würden.

Hier gibt es eine ernsthafte ethische Linie, die ich ausdrücklich benennen möchte: Trainieren Sie Soul ID nicht auf Fotos von echten Menschen ohne deren ausdrückliche Zustimmung. Nur weil die Technologie es zulässt, heißt das nicht, dass es in Ordnung ist. Verwenden Sie Aktien mit entsprechenden Lizenzen, Ihre eigenen Fotos oder bezahlte Models, die sich für die Nutzung mit AI angemeldet haben. Das Werkzeug ist zu leistungsstark, um unachtsam damit umzugehen.

Die wahre Preisberechnung: Was 1.000 Higgsfield-Credits tatsächlich kaufen

Zeit für den Teil, den niemand richtig beziffert. Ich habe während dieser Sitzung 387 Credits verbrannt. Hier ist die Aufschlüsselung:

  • Bilderzeugung (Nano Banana 2, mehrere Iterationen): Ungefähr 60 Credits für den Ghibli-Helden, die Cover des Albumrasters und eine Handvoll Testaufforderungen. Bei 2 Credits pro Iteration sind das insgesamt 30 Iterationen. - Videogenerierung (Kling 3.06, 5-Sekunden-Schleife): 42 Credits für einen Torwart. Ich musste es einmal neu generieren, weil die erste Version nicht sauber geloopt wurde, sodass die tatsächlichen Kosten 84 Credits betrugen, um einen brauchbaren Clip zu erhalten. - Soul-ID-Charaktertraining: 40 Credits für das Eli-Training, dann weitere 40 für einen zweiten Charakter. - Soul-ID-Charaktergenerierung (Eli, 12 Generationen während der Sitzung): Ungefähr 20 Credits bei 1,5–2 Credits pro Ausgabe. - Seitenrendering, Dateioperationen, HTML/CSS-Generierung: Keine Higgsfield-Credits – das sind alles Claude Code, abgerechnet über mein Claude-Abonnement.

  • Verschiedene Bildexperimente und Wiederholungen: Ungefähr 100 Credits für verschiedene Tests, auf die ich nicht näher eingegangen bin.

Für 387 Credits habe ich also eine funktionierende animierte Landingpage, zwei trainierte Charakter-Avatare, ein fünf Sekunden langes Helden-Loop-Video und drei wiederverwendbare Fähigkeiten erhalten. Gemäß der aktuellen Preisstruktur von Higgsfield, bei der man für einen Dollar etwa 16 Credits kauft, habe ich in dieser Sitzung etwa 24 Credits im Wert von $ erhalten.

Die Pläne, die diese Credits liefern, sehen in der Preisgestaltung 2026 von Higgsfield wie folgt aus:

  • Kostenloses Kontingent: 150 Credits pro Monat. Genug, um zwei oder drei kleine Experimente durchzuführen. Nützlich zum Treten der Reifen.
  • Starterplan: 15 $ pro Monat für die Jahresrate, 200 Credits monatlich. Der Sinn dieser Stufe ist „Ich möchte gelegentlich echte Workflows ausführen“ – eine vollständige Landingpage-Sitzung pro Monat mit Restguthaben.
  • Mittelstufe: Etwa 39 US-Dollar pro Monat bei der höheren monatlichen Rate, die Gutschrift erhöht sich um das Fünf- bis Sechsfache. Die richtige Stufe, wenn Sie diesen Stack wöchentlich oder für Kundenarbeiten ausführen.
  • Höhere Stufen (Starter Plus, Ultra): Bis zu etwa 84 US-Dollar pro Monat für intensive Produktionsnutzung mit Kreditzuteilungen, die für die tägliche Inhaltsausgabe ausgelegt sind.

Die Rechnung, die für die meisten Leser wichtig ist: Wenn Sie dies ein- oder zweimal testen, reicht die kostenlose Stufe aus. Wenn Sie es im Rahmen Ihres Workflows monatlich ausführen, ist Starter für 15 $ ausreichend. Wenn Sie dies wie ich nutzen, um ein kleines Content-Unternehmen mit mehreren Marken zu betreiben, ist die mittlere Ebene der Ort, an dem es angesiedelt ist.

Es gibt einen Preis, den die meisten Menschen vergessen. Claude Code selbst läuft auf einem kostenpflichtigen Claude-Abonnement. Sie können nichts davon auf der kostenlosen Stufe von Claude ausführen. Meine Nutzung dort beträgt durchschnittlich weitere 20 $ an API-Kosten pro Monat zusätzlich zu den Higgsfield-Credits, und Anthropic bietet einen 20 $/month Claude Pro-Plan plus höhere Stufen für Vielnutzer an. Integrieren Sie das in Ihr Budget.

Fähigkeiten, die ich aus dieser Sitzung gespeichert habe und die Sie stehlen können

Das Muster, auf das ich immer wieder zurückkomme: Der Wert liegt nicht in einer einzigen Sitzung, sondern in den wiederverwendbaren Fähigkeiten, die die Sitzung hervorgebracht hat. Am Ende des Builds hatte ich drei Fähigkeiten bei ~/.claude/skills/, die ich wöchentlich nutzen werde. Den Ghibli-Heldengenerator habe ich euch bereits gezeigt. Die anderen beiden:

Animierter Produkt-Hero-Bereich. Eine Fertigkeit, die bei gegebener Produktbeschreibung ein Hero-Bild, ein Fünf-Sekunden-Loop-Video und einen vollständig responsiven HTML/CSS-Hero-Block generiert, wobei das Video für die durch Scrollen ausgelöste Wiedergabe verkabelt ist. Ungefähr fünfzig Zeilen von skills.md. Kosten pro Lauf: etwa 50 Higgsfield-Credits plus ein paar hundert Claude-Tokens. Ersetzt den früher sechsstündigen Multitool-Workflow.

Markenkonsistenter Charaktergenerator. Eine Fähigkeit, die eine Soul-ID-Charakter-ID und eine Szenenbeschreibung verwendet und dann ein konsistentes Charakterbild in mehreren Seitenverhältnissen generiert – quadratisch, 4:5 für Instagram, 9:16 für Geschichten, 16:9 für YouTube. Ungefähr fünfunddreißig Zeilen von skills.md. Kosten pro Lauf: ca. 6–10 Higgsfield Credits, je nachdem, wie viele Größen im Auftrag gefordert werden.

Der Grund, warum ich ständig auf Fertigkeiten herumbastle: Jedes Mal, wenn ich einen Workflow als Fertigkeit speichere, kaufe ich bei jedem zukünftigen Durchlauf Zeit zurück. Der erste Durchgang ist explorativ und kostet volle Aufmerksamkeit. Der hundertste Lauf ist eine Zeile. Wenn man das über ein Jahr lang mit Multi-Marken-Inhalten zusammenzählt, wird die Hebelwirkung schnell dämlich. Eine ausführlichere Version dazu habe ich im Leitfaden für fortgeschrittene Agenten geschrieben, falls Sie das vollständige mentale Modell wünschen.

Wo dieser Stapel auseinanderfällt (und was man dagegen tun kann)

Ich möchte mit der ehrlichen Kritik enden, weil ich jedem Tutorial gegenüber skeptisch bin, das mit „Und es hat alles perfekt funktioniert“ endet. Dieser Stapel hat echte Grenzen.

Der Agent trifft Designentscheidungen, die Sie nicht treffen würden. Wenn ich Claude seine eigene Typografie, seinen Farbkontrast oder seine Bildkomposition ohne klare Markenspezifikation auswählen lasse, tendiert das Ergebnis in Richtung einer generischen Technologie-Startup-Ästhetik. Die Lösung besteht darin, einmal eine Markenspezifikations-Markdown-Datei zu schreiben und sie in jeden relevanten Skill einzuspeisen. Ohne diese Spezifikation erhalten Sie den Durchschnitt aller Zielseiten, die Claude jemals gesehen hat.

Die Videoerzeugung ist immer noch langsam und teuer. Fünf Sekunden von Kling 3.06 entsprechen zweieinhalb Minuten Renderzeit und 42 Credits pro Keeper. Zwanzig Sekunden sind ungefähr das Vierfache davon. Wenn Sie ein einminütiges Markenvideo benötigen, erstellen Sie es nicht auf diesem Stapel – Sie fügen kürzere Clips zusammen. Alles, was länger als zehn Sekunden dauert, macht die Einheitsökonomie vorerst zunichte.

Die Konsistenz der Seelen-ID verschlechtert sich, wenn zu wenige Referenzfotos vorhanden sind. Fünf Fotos eignen sich für den gelegentlichen Gebrauch. Trainieren Sie für die Arbeit mit Kunden mit mehr als 20 Bildern aus unterschiedlichen Winkeln und mit unterschiedlicher Beleuchtung, sonst gerät Ihr Charakter in den Hintergrund der Generationen.

MCP-Tools sind noch ausgereift. Ich bin auf einen Fehler gestoßen, bei dem Higgsfield Claude hat es schließlich erneut versucht und wiederhergestellt. Ein naiverer Workflow wäre zum Absturz gekommen. Bauen Sie Wiederholungsversuche in Ihre Fähigkeiten ein.

Berechtigungen schleichen sich ein. Die Ausführung mit --dangerously-skip-permissions bedeutet, dass der Agent überall dort schreiben kann, wo er Zugriff hat. Ich bewahre diesen Stapel in einem Sandbox-Scratch-Verzeichnis auf und kopiere die fertigen Ausgaben manuell in echte Projektordner. Disziplin ist wichtig.

Die Modellabwanderung hört nicht auf, nur weil MCP existiert. Die MCP-Abstraktion macht den Austausch von Modellen kostengünstig. Die Auswahl des richtigen Modells ist dadurch nicht trivial. Sie müssen immer noch wissen, dass Nano Banana 2 großartig für stilisierte Bilder ist, für fotorealistische Menschen jedoch schwächer ist, oder dass Kling 3.06 filmische Kamerabewegungen besser bewältigt als Veo 3.1 für Produktbewegungen. Der MCP ist die Verkabelung. Der Geschmack ist immer noch die Arbeit.

Was ich als nächstes sehen werde

Drei Dinge, auf die ich im nächsten Quartal achten werde.

Veo 3.1 vs. Sora 2 für Produktvideo. Beide wurden dieses Jahr ausgeliefert. Auf beide kann über MCP von Higgsfield zugegriffen werden. Beide sind ausgezeichnet. Ich habe noch kein direktes Duell mit der gleichen Marke und der gleichen Aufforderung durchgeführt. Das ist der nächste Test in diesem Stapel, und das Ergebnis wird sich wahrscheinlich ändern, welches Modell meine Fertigkeit „Animierter Held“ standardmäßig verwendet.

Antigravity, die IDE von Anthropic. Antigravity bietet erstklassige MCP-Unterstützung und ist speziell für die agentengesteuerte Entwicklung positioniert. Wenn die Higgsfield-Fähigkeiten dort genauso sauber funktionieren wie in Claude Code, wird die Wahl zwischen den beiden eher zu einer Workflow-Präferenz als zu einer Fähigkeitsfrage. Ich habe die Anti-Gravity-IDE-Positionierung bei der Auslieferung behandelt.

Skill-Marktplätze. Im Moment schreibe ich meine eigenen skills.md-Dateien. Das Higgsfield-Skill-Bundle ist einer der ersten Fälle, in denen eine externe Partei Fertigkeiten in Produktionsqualität als Paket verschickt. Wenn sich daraus ein echtes Ökosystem entwickelt – Erkennung, Versionierung, Abhängigkeiten im NPM-Stil – erhöht sich der Einfluss auf jeden einzelnen Ersteller um eine weitere Größenordnung. Ich würde wetten, dass dies vor Ende 2026 geschieht.

Die einzeilige Zusammenfassung, wenn Sie sich nur an eines erinnern: Der Wert eines Content-Betriebssystems liegt in keinem einzelnen Modell. Durch die Verkabelung sind die Modelle austauschbar, die Arbeitsabläufe wiederverwendbar und der Agent ist in der Lage, „Bild“, „Video“, „Seite“ und „Animation“ als Verben im selben Satz zu behandeln. Higgsfield's MCP ist die Verkabelung. Claude Code ist der Agent. Fähigkeiten sind die Arbeitsabläufe. Codex ist das zweite Paar Hände. Keines dieser Stücke ist diese Woche neu. Neu ist, dass sie endlich komponieren, ohne sich gegenseitig zu bekämpfen.

Was in der nächsten Stunde zu tun ist

Wenn Sie bis hierher gelesen haben, finden Sie hier die kleinste Sache, die Sie heute Abend tun können und die in sechs Monaten von Bedeutung sein wird.

Installieren Sie den Higgsfield MCP in Claude Code. Führen Sie eine Bildgenerierung über Nano Banana 2 aus. Speichern Sie die Eingabeaufforderung als Skill.md-Datei. Das ist es. Drei Schritte. Ungefähr zehn Minuten. Das kostenlose Kontingent deckt alles ab.

Der Grund, warum dies wichtig ist, ist der gleiche, warum jeder genutzte Workflow wichtig ist – die Kosten für den Start sind gering und die Kosten für das Warten auf Verbindungen. In sechs Monaten verfügen Sie entweder über eine Sammlung von Fähigkeiten, die Sie in Dutzenden von Läufen verfeinert haben, oder Sie werden heute Abend dort sein, wo Sie sind. Der erste Lauf ist der einzige, der Mut erfordert. Jeder Lauf danach ist ein Funktionsaufruf.

Ich gehe zurück zum Terminal. Es gibt ein Heldenbild für den nächsten colorpark.io-Beitrag, das bis zum Morgen existieren muss, und die Ghibli-Fertigkeit ist nur zwei Worte davon entfernt, es zu rendern.

Häufig gestellte Fragen

Benötige ich sowohl Codex als auch Claude Code, um diesen Stack auszuführen?

Nein – Claude Code allein reicht aus, um den vollständigen Higgsfield MCP-Workflow auszuführen. Ich lasse Codex Informationen zur Dual-Agent-Argumentation finden Sie oben in der Codex- und Claude Code-Workflow-Aufschlüsselung.

Wie viel kostet das Full-Content-Betriebssystem tatsächlich pro Monat?

Planen Sie je nach Nutzungsvolumen Higgsfield-Guthaben im Wert von 15 bis 39 US-Dollar pro Monat sowie ein Claude-Abonnement im Wert von über 20 US-Dollar ein. Vielproduzente, die täglich Inhalte veröffentlichen, landen bei Higgsfield bei etwa 84 US-Dollar pro Monat. Die vollständige Aufschlüsselung finden Sie im Abschnitt zur Preisberechnung oben.

Funktionieren meine bestehenden Higgsfield-Planguthaben über MCP?

Ja. Die Authentifizierung erfolgt über Ihr bestehendes Higgsfield-Konto und bestehende Planguthaben werden ohne Änderungen auf den MCP übertragen. Es gibt keinen separaten „MCP-Credits“-Pool – es handelt sich um ein Wallet, das von der Web-App gemeinsam genutzt wird: CLI und MCP.

Was passiert mit meinem Workflow, wenn Higgsfield neue Modelle hinzufügt?

Nichts – das ist der Sinn der MCP-Abstraktion. Neue Modelle werden auf der Seite von Higgsfield registriert und können über dieselben MCP-Befehle aufgerufen werden. Sie ändern eine Modellnamenzeichenfolge in Ihrer skills.md, wenn Sie zu einer neueren wechseln möchten, und Ihre bestehende Pipeline läuft unverändert weiter.

Kann ein Nicht-Programmierer diesen Stack tatsächlich ausführen?

Größtenteils ja für die Installation und die Eingabeaufforderungen, mit einer ehrlichen Einschränkung: Das Debuggen, wenn der Agent etwas Unerwartetes tut, erfordert Komfort beim Lesen der Terminalausgabe. Die Installation besteht aus drei Befehlen. Die Eingabeaufforderungen sind in einfachem Englisch gehalten. Bei den Skills handelt es sich um Markdown-Dateien. Aber wenn der MCP einen Fehler zurückgibt oder sich ein Skill schlecht verhält, müssen Sie bereit sein, zu lesen, was das Terminal Ihnen sagt. Wenn das in Ordnung ist, ist der Rest erreichbar.

Lasst uns zusammenarbeiten

Möchten Sie AI-Systeme aufbauen, Arbeitsabläufe automatisieren oder Ihre technische Infrastruktur skalieren? Ich würde gerne helfen.

Coffee cup

Hat Ihnen dieser Artikel gefallen?

Ihre Unterstützung hilft mir, mehr tiefgehende technische Inhalte, Open-Source-Tools und kostenlose Ressourcen für die Entwickler-Community zu erstellen.

Verwandte Themen

Engr Mejba Ahmed

Über den Autor

Engr Mejba Ahmed

Engr. Mejba Ahmed builds AI-powered applications and secure cloud systems for businesses worldwide. With 10+ years shipping production software in Laravel, Python, and AWS, he's helped companies automate workflows, reduce infrastructure costs, and scale without security headaches. He writes about practical AI integration, cloud architecture, and developer productivity.

Discussion

Comments

0

No comments yet

Be the first to share your thoughts

Leave a Comment

Your email won't be published

2  +  8  =  ?

Weiter lernen

Verwandte Artikel

Alle anzeigen

Comments

Leave a Comment

Comments are moderated before appearing.

Learning Resources

Expand Your Knowledge

Accelerate your growth with structured courses, verified certificates, interactive flashcards, and production-ready AI agent skills.

Sample Certificate of Completion

Sample certificate — complete any course to earn yours

Engr Mejba Ahmed

Engr Mejba Ahmed

Claude Code Expert · Online

👋

Hey there!

Quick Actions

WhatsApp Instant reply

Chat on WhatsApp

+880 1723 741224 · Instant reply

Popular Questions

Engr Mejba Ahmed is connected
Engr Mejba Ahmed is typing...
Engr Mejba Ahmed avatar

✉ Want me to follow up? Drop your email

Engr Mejba Ahmed avatar

📞 Connect Directly

Choose how you'd like to reach me

WhatsApp

+880 1723 741224

Email

[email protected]

✓ Details sent! I'll get back to you shortly.

Powered by OpenAI

335+

Blog Posts

25

AI Courses

63

Projects

Services & Expertise

Pricing & Process

Learning & Resources

Connect & Support