Claude Code Visual OS: Das Dashboard, das meine Crew brauchte

Ich habe mir Jacks Video an einem Sonntagnachmittag mit einem halb leeren Kaffee und dem selbstgefälligen Selbstvertrauen von jemandem angesehen, der bereits einen funktionierenden Claude Code-Stack betreibt.

Aria schreibt meine Beiträge. Hermes leitet meine persönliche Wissensarbeit. Codex verarbeitet die Zweitmeinungs-Codierungsschleife. Mit dem MCP von Higgsfield 2 erhalte ich dreißig Bild- und Videomodelle von einem Terminal aus. Ich habe Fähigkeiten, Subagenten, Slash-Befehle, einen Obsidian-Tresor, der über Pinecone verkabelt ist, eine Supabase-Protokolltabelle und einen CLAUDE.md für jedes Projekt. Nach vernünftigem Ermessen habe ich die Spielautomatenphase hinter mir.

Vierzig Minuten nach Beginn des Videos war diese Selbstgefälligkeit verschwunden.

Jack demonstrierte, was er ein Claude Code visuelles Betriebssystem nennt – ein einziges Dashboard, das jedes Modell, jeden Speicher, jede Fertigkeit, jede Token-Ausgabe und jede Konversation in seinem AI-Stack in einem sich selbst verbessernden Bedienfeld verbindet. Kein Nutzungs-Tracker. Kein Abrechnungs-Dashboard. Eine tatsächliche Betriebsebene mit sechs Säulen und einer „träumenden“ Engine, die jede Nacht läuft, um neue Fähigkeiten vorzuschlagen, tote Fähigkeiten zu beschneiden, sich wiederholende Eingabeaufforderungen zu kennzeichnen und seinen Arbeitsablauf still und leise neu zu gestalten, während er schläft.

Ich habe zweimal zurückgespult. Nicht, weil mir die Idee unbekannt war – ich habe ein Jahr lang Teile davon mit der Hand gerollt –, sondern weil endlich jemand die Form des Dings gezeichnet hatte, habe ich fast immer weiter gebaut und es nie zu Ende gebracht.

Dieser Beitrag ist meine Reaktion. Was Jack gebaut hat, was daran ab Mai 2026 real ist (das Dreaming-Feature wurde am 6. Mai an Claude Managed Agents bei Code mit

Wenn Sie drei oder vier AI-Abonnements und einen Friedhof halb erprobter Fähigkeiten unter einen Hut bringen, ist dies der Beitrag, den ich vor sechs Monaten wollte.

Das wahre Problem, das niemand beim Namen nennt

Bevor das Dashboard einen Sinn ergibt, muss der Schmerz spezifisch sein. Lassen Sie mich also konkret auf meine eingehen.

Im Mai 2026 zahle ich aktiv für Claude Pro Max, OpenAI Pro für 200 US-Dollar (das dauerhaft auf ein 20x-Plus-Kontingent umgestellt wurde), Gemini Advanced, Higgsfield-2-Credits, einen serverlosen Pinecone-Index, ein Supabase-Pro-Projekt und Obsidian Sync. Auf derselben Maschine sind Claude Code, Codex CLI, Gemini CLI, Hermes Agent und Cursor installiert - Cursor nutze ich nicht mehr, ich habe ihn nur noch nicht deinstalliert. Aria hat 11 Skills. Mein persönlicher .claude/skills/-Ordner hat 27. Die Hälfte davon habe ich seit einem Monat nicht berührt.

Wenn etwas kaputt geht oder wegdriftet, habe ich keine Antwort auf die grundlegendste Frage, die ein Bauunternehmer beantworten sollte: Welcher Teil meines Stapels verdient gerade tatsächlich seinen Lebensunterhalt?

Ich weiß es ungefähr. Claude Opus 4.7 (veröffentlicht am 16. April, mit denselben 5/25 US-Dollar pro Million Tokens wie 4.6, aber mit einem neuen Tokenizer, der für denselben Eingabetext bis zu 35 % mehr Tokens erzeugt - eine echte Kostenänderung hinter einem "unverändert"-Sticker) schreibt meine Longform-Beiträge. Sonnet 4.6 erledigt strukturierte Aufgaben für 3/15 US-Dollar. Haiku 4.5 übernimmt die günstigen Zwischenaufrufe für 1/5 US-Dollar. Das 1M-Token-Kontextfenster ist zu Standardpreisen für Opus 4.7, Opus 4.6 und Sonnet 4.6 verfügbar, was bedeutet, dass eine 900k-Token-Anfrage zum selben Token-Stückpreis abgerechnet wird wie eine 9k-Token-Anfrage. Ich kenne diese Zahlen. Ich weiß nicht, welcher meiner Skills welches Modell nutzt oder ob einer davon still Opus aufruft, obwohl Haiku die Arbeit für ein Fünftel der Kosten erledigt hätte.

Das ist die Form des Problems. Die Agenten laufen. Die Rechnungen kommen. Die Ausgabe erfolgt im Versand. Und die Sichtbarkeitsebene, die mich mit Zuversicht sagen lässt: Dieser Skill hat mir diesen Monat 400 $ meiner Zeit eingebracht, und dieser hier ist ein Vampir – diese Ebene existiert in keinem der offiziellen Anthropic- oder OpenAI-Dashboards. Es existiert nicht in der Konsole von Pinecone. Es existiert nirgendwo.

Jacks Meinung ist, dass es so sein sollte. Und dass es gebaut werden kann.

Das hat mich dazu gebracht, zurückzuspulen.

Was Jacks Claude Code Visual OS eigentlich ist

Entfernen Sie den Rahmen und Jacks System besteht aus einem Armaturenbrett, das auf sechs Säulen steht. Die Säulen sind keine Features – sie sind Datenquellen, die das Betriebssystem benötigt, um über Ihr AI-Leben nachzudenken. Das Armaturenbrett vereint sie. Der Traummotor wirkt auf sie.

Hier sind die sechs, so wie Jack sie dargelegt hat, mit meiner eigenen Lektüre aus der ersten Person, warum jeder einzelne wichtig ist.

Säule eins: Modelle

Jedes Modell, das Sie verwenden, jeder Plan, für den Sie bezahlen, mit seinen Kosten, Limits und der aktuellen Preisstufe wird in einer Ansicht angezeigt. Kein Screenshot Ihrer Anthropic-Konsole – ein Live-Tisch, der weiß, dass Sie auch für Codex, Gemini Advanced und Higgsfield bezahlen, und der diese nebeneinander stellt.

Der Grund dafür ist, dass die Modellabwanderung brutal ist. Opus 4.7 wurde am 16. April ausgeliefert. Gemini 3.2 Flash wird ohne Ankündigung in iOS getestet. GPT-5.4 befindet sich in Codex mit einem anderen Kostenprofil als das Webprodukt von ChatGPT. Wenn Ihr Dashboard nicht weiß, welche Modelle Sie anrufen können, kann es Ihnen beim Starten einer Sitzung nicht dabei helfen, das richtige Modell auszuwählen.

Säule zwei: Erinnerung

An jedem Ort speichert Ihr Stack den Kontext – lokale Dateien, Obsidian-Tresore, Pinecone-Indizes, Supabase-Tabellen, unformatierte SQL-Datenbanken – verbunden und sichtbar.

Hier brechen die meisten Stapel. Im März liefen bei mir vier Speicherebenen und ich hatte eine unklare Vorstellung davon, was sich in jeder einzelnen befand. Eine über die falsche Ebene weitergeleitete Suchanfrage ist nicht nur langsamer; Es zieht den falschen Kontext in eine Eingabeaufforderung und vergiftet stillschweigend die Ausgabe. Das Betriebssystem sollte wissen, dass meine Fakten zur „Markenstimme“ in Obsidian, meine Projektprotokolle in Pinecone und meine Agentenprotokolle in Supabase gespeichert sind, und es sollte für jede Abfrage die richtige auswählen, ohne dass ich darüber nachdenken muss.

Säule drei: Fähigkeiten

Jede einzelne Fähigkeit, die Sie geschrieben, verfolgt, bewertet und (dies ist der Teil, den die meisten Setups übersehen) auf Effizienz bereinigt haben.

Das Betriebssystem listet alle Fähigkeiten auf. Hier erfahren Sie, wann jede einzelne Ausführung das letzte Mal ausgeführt wurde, wie oft sie erfolgreich war, wie viel Geld sie verdient oder gespart hat und wie viel sie in Token pro Ausführung kostet. Fertigkeiten, die 90 Tage lang nicht aufgerufen wurden, werden zur Archivierung markiert. Fertigkeiten, die auf den ersten Blick teuer sind, werden zur Umgestaltung markiert. Fähigkeiten, die sich in hohem Maße durchsetzen, werden gefördert.

Die meisten Leute behandeln ihren Kompetenzordner wie einen Schrank – Sachen kommen rein, nichts kommt raus. Das Betriebssystem behandelt es wie eine Mannschaftsliste mit vierteljährlichen Überprüfungen.

Säule vier: Wissenssysteme

Verbundene Repositories, die Referenzmaterial bereitstellen, das der Agent bei Bedarf abrufen kann. Dokumentation. Notizen. Referenzprojekte. Leselisten. Das Ergebnis Ihrer Traumsitzungen.

Dies ist die Ebene, die sich mit der Erinnerung überschneidet, aber konzeptionell anders ist. Erinnerung ist das, was der Agent produziert. Wissen ist das, was es zu Rate ziehen kann. Das Betriebssystem verfolgt beides und macht den Unterschied lesbar – denn wenn man sie zusammenführt, landet man bei einem Agenten, der selbstbewusst seine eigene Halluzination von vor drei Wochen als Quelle anführt.

Säule fünf: Nutzung und Kosten

Token-Verbrauch, Abonnementkosten und gesamte finanzielle Auswirkung, aufgeschlüsselt nach Kompetenz, Projekt, Marke und Modell.

Kein Abrechnungs-Dashboard. Eine finanzielle Wahrheitsschicht. Die Antwort lautet: Wie viel von der Anthropic-Rechnung dieses Monats stammte von Aria, die mejba.me-Beiträge schrieb, im Vergleich zu ramlit.com-Fallstudien? Welche Fertigkeit hat diese Woche die meisten Opus-Tokens verbrannt? Liegt meine Cache-Trefferquote bei den langen Posts tatsächlich bei 60 %, wie ich denke, oder ist sie stillschweigend auf 18 % gesunken, weil ich die Systemaufforderung letzten Dienstag umgestaltet habe?

Ich habe die grobe Version dieses Problems in meinem Claude Code MCP install/cut-Beitrag behandelt - jeder MCP-Server, den Sie laden, verlangt Miete in Kontext-Tokens, ob Sie ihn nutzen oder nicht. Das OS würde diese Miete über jeden Server, jeden Skill und jede Sitzung hinweg sichtbar machen.

Säule sechs: Das Traumsystem

Die automatisierte Analyseebene, die überwacht, was Sie gestern getan haben, und Verbesserungen für morgen vorschlägt. Wiederholte Aufforderungen, die zu Fähigkeiten werden sollten. Fähigkeiten, die zusammengeführt werden sollten. Modelle, für die Sie zu viel bezahlen. Eine Erinnerung, die abgestanden ist. Neue Tools, die zu Ihrem Workflow passen.

Dies ist die Säule, die das Dashboard von einem Bericht in einen Agenten verwandelt. Und hier hörte Jacks Pitch für mich auf, theoretisch zu sein – denn am 6. Mai 2026 hat Anthropic tatsächlich eine Traumfunktion in Claude Managed Agents ausgeliefert**, und sie macht fast genau das, was Jack beschrieben hat.

Lassen Sie mich darauf zurückkommen, denn es verändert das gesamte Gespräch.

Die Dreaming-Funktion ist jetzt real

Anthropic kündigte Dreaming auf der Entwicklerkonferenz „Code with Mir wurde noch kein Zugriff gewährt. Aber die öffentliche Dokumentation sagt mir viel darüber, wie Anthropic denkt, dass diese Ebene funktionieren sollte.

Ein „Traum“ wird als geplanter Hintergrundprozess zwischen Agentensitzungen ausgeführt. Es liest den vorhandenen Speicher zusammen mit den Transkripten vergangener Sitzungen und erstellt einen neuen, neu organisierten Speicher. Duplikate zusammengeführt. Veraltete Einträge werden durch den neuesten Wert ersetzt. Widersprüche gelöst. Neue Erkenntnisse kamen ans Licht.

Die Community-Beiträge nennen die benutzerorientierte Variante Auto Dream oder AutoDream für Claude Code. Der Mechanismus, der mir am meisten aufgefallen ist: Träumen wandelt relative Daten in absolute Daten um. „Gestern haben wir uns für Redis entschieden“ wird zu „Am 15.03.2026 haben wir uns für Redis entschieden.“ Dies ist die Art von Detail, die langweilig klingt, bis Sie gesehen haben, wie ein Agent selbstbewusst eine „aktuelle“ Entscheidung von vor sechs Monaten zitiert und einen Nachmittag damit verbringt, die Verwirrung zu entwirren.

Der härtere Satz aus dem Blog von Anthropic: * „Träumen bringt Muster zum Vorschein, die ein einzelner Agent für sich allein nicht erkennen kann, darunter wiederkehrende Fehler, Arbeitsabläufe, an denen sich Agenten orientieren, und im gesamten Team geteilte Präferenzen.“*

Lesen Sie das noch einmal mit Jacks sechs Säulen im Kopf. Das ist die sechste Säule, die in Anthropics eigenen Worten beschrieben wird. Die Legal-Tech-Firma Harvey berichtet, dass ihre Managed-Agent-Abschlussquoten bei traumgestützten Tests zur Erstellung von Langform-Entwürfen und Dokumentenerstellung etwa um das Sechsfache gestiegen sind.

Sechs. X.

Für mich als Entwickler bedeutet dies, dass das von Jack entworfene visuelle Betriebssystem keine Fantasie ist, die ein benutzerdefiniertes Backend erfordert, das niemand erstellen kann. Die härteste Säule – die, von der ich behauptet hätte, dass sie im Mai noch Jahre entfernt wäre – Anthropic wurde gerade als Managed Service ausgeliefert. Der Rest des Betriebssystems ist Sanitär.

Was bedeutet, dass die einzige ehrliche Frage bleibt: Wie würde ich das eigentlich in meine Crew integrieren?

Wie ich das Visual OS in meinen Aria-Stack integrieren würde

Lassen Sie mich das so beschreiben, wie ich es einem Freund beschreiben würde, der Claude Code seit sechs Monaten betreibt und nun endlich bereit ist, von Skills-in-a-Folder zu einer echten Kontrollebene aufzusteigen.

Es gibt fünf Stufen. Keiner von ihnen erfordert einen Unternehmensplan. Bei allen wird davon ausgegangen, dass Sie Claude Code bereits installiert haben und mindestens ein Projekt mit einem .claude/-Verzeichnis.

Stufe eins: Modellerkennung

Das Betriebssystem scannt Ihren Computer und Ihre Konten beim ersten Start. Es sucht nach installierten CLIs (Claude Code, Codex, Gemini CLI, Hermes), lokalen API-Schlüsseldateien, Umgebungsvariablen und aktiven Abonnements. Es erstellt die Modelltabelle.

In meinem Fall würde diese Tabelle derzeit Opus 4.7 mit dem 1M-Kontextfenster, Sonnet 4.6 (der tägliche Treiber – 3 $/15 $ mit dem gleichen 1M-Kontext), Haiku 4.5 (1 $/5 $, der Kostensenker), GPT-5.4 über Codex, Gemini 3 Pro über den Gemini enthalten CLI und welches Higgsfield-Modell ich zuletzt über MCP aufgerufen habe. Das Betriebssystem muss nicht jeden einzelnen aufrufen. Es muss nur wissen, dass es sie gibt und was sie jeweils kosten.

Warum das wichtig ist: Wenn Aria einen neuen Beitrag für mejba.me startet, sollte das Betriebssystem in der Lage sein, einen Blick auf die Aufgabe zu werfen und sie an das günstigste Modell weiterzuleiten, das die Aufgabe noch erledigen kann. Langer Beitrag mit 3.000 Wörtern und Einschränkungen bei der Markenstimme? Opus 4.7 mit aktiviertem Prompt-Caching (Anthropic bietet bis zu 90 % Kosteneinsparungen bei zwischengespeicherten Eingabe-Tokens, was enorm ist, wenn in jeder Sitzung derselbe System-Prompt läuft). Kurze strukturierte Extraktion? Haiku jedes Mal 4,5.

Ich bezahle nicht für Intelligenz. Ich bezahle für angemessene Intelligenz. Das Betriebssystem macht den Unterschied lesbar.

Stufe zwei: Speichereinrichtung

Ein geführter Assistent verbindet jede Ihrer Speicherquellen. Für mich bedeutet das:

Obsidian-Tresor bei ~/vault/ – Markenregeln, Sprachbeschränkungen, Agentendefinitionen, Beitragsgliederungen
Pinecone serverloser Index – Langform-Postarchive, vektorisiert für semantische Erinnerung, die Quelle, aus der Aria greift, wenn sie über ein Thema schreibt, das sie zuvor behandelt hat
Supabase-Protokolltabelle – jede Agentensitzung, jeder Tool-Aufruf, jede input/output-Token-Anzahl, jede Modellauswahl
Lokale .claude/skills/ und .claude/agents/ – die tatsächlichen Skill-Definitionen und Subagenten-Spezifikationen
Claude Speicher API – die neue persistente Kontextschicht, die Anthropic Anfang des Jahres ausgeliefert hat

Das Betriebssystem ersetzt keines davon. Es verbindet sie und weist jedem eine Rolle zu. Obsidian für Fakten, die der Agent bearbeiten kann. Pinecone für semantischen Rückruf über Volumen. Supabase für den Audit-Trail. Der Memory API für die träumende Ebene.

Das tiefere architektonische Argument dafür habe ich in meinem Pinecone-Nexus-Beitrag zu Agentic RAG behandelt - die Quintessenz ist: Retrieval sollte, wann immer möglich, zur Compile Time stattfinden, nicht zur Query Time. Das OS macht diese Unterscheidung operational.

Stufe drei: Zeitwert definieren

Dies ist der Schritt, den die meisten Bauherren überspringen und der das Dashboard von einer Eitelkeitsschicht in eine Ebene der finanziellen Wahrheit verwandelt.

Sie sagen dem Betriebssystem, was eine Stunde Ihrer Zeit wert ist. Konkret. In Dollar. Nicht „Ich möchte irgendwann 200/hr verdienen.“ Im Moment zu der Arbeit, die Sie tatsächlich in Rechnung stellen: mein Agenturtarif, mein Beratungstarif, mein realistischer Content-Tarif.

Der Grund dafür ist, dass dies wichtig ist: Der ROI jeder Fertigkeit ist eine Funktion der eingesparten Zeit multipliziert mit Ihrem Stundenwert abzüglich der Token-Kosten. Bis das Betriebssystem Ihren Stundensatz kennt, ist „Diese Fähigkeit hat Ihnen 14 Minuten gespart“ nur eine Statistik. Sobald das Betriebssystem weiß, dass Ihre Rechnung 150 $/hour beträgt, wird aus „Dieser Skill hat Ihnen 14 Minuten gespart“ zu „Dieser Skill hat Ihnen heute 35 $ eingebracht, bei einem symbolischen Preis von 0,42 $, also netto 34,58 $.“

Multiplizieren Sie das mit 27 Fähigkeiten und Sie haben endlich eine ehrliche Antwort auf die Frage, mit der ich diesen Beitrag begonnen habe: Welcher Teil meines Stapels verdient seinen Lebensunterhalt?

Stufe vier: Der Traummotor

Planen Sie einen nächtlichen Traumlauf. Das Betriebssystem speist die Sitzungsprotokolle und den Speicherstatus von gestern in einen Claude Opus 4.7-Aufruf mit einer strukturierten Eingabeaufforderung ein. Die Ausgabe ist ein Markdown-Bericht:

Wiederholte Aufforderungen, die diese Woche mehr als drei Mal auftraten und zu einer Fertigkeit werden sollten
Vorhandene Fertigkeiten, die ausgelöst wurden, aber fehlschlugen, mit ihrem Fehlermodus
Speichereinträge, die neueren Einträgen widersprechen
Kostenanomalien – Sitzungen, bei denen mehr Token verbrannt wurden als der 30-Tage-Median für diese Aufgabe
Modellfehlausrichtung – Aufgaben, die auf Opus ausgeführt wurden, als Sonnet oder Haiku ausgereicht hätten
Vorgeschlagene neue Fähigkeiten basierend auf Mustern, die die Traumschleife bemerkt hat

Für den Teil davon, der der offiziellen Traumschicht der Managed Agents entspricht, delegieren Sie an die Forschungsvorschau von Anthropic, sobald Sie Zugriff erhalten. Für den Rest schreiben Sie einen Traum-Skill, der Ihre Supabase-Protokolltabelle und Ihren Obsidian-Tresor liest und die gleiche Berichtsform erstellt.

Das Muster ist in beiden Fällen das gleiche. Die Daten von gestern werden zum Plan von morgen, ohne dass Sie jedes Transkript selbst lesen müssen.

Das ist die proaktive AI-Verschiebung, die Jack in seinem Video immer wieder erwähnte. Das reaktive Modell lautet: „Ich öffne Claude Code, ich denke darüber nach, was ich will, ich fordere auf.“ Das proaktive Modell lautet: „Ich öffne Claude Code. Das Betriebssystem hat bereits bemerkt, dass ich Aria an drei der letzten fünf Dienstage gebeten habe, denselben Konkurrenten zu recherchieren, und es schlägt vor, dass ich das als competitor-scan-Skill mit gesperrten kanonischen Eingaben speichere.“ Eines davon ist das Glücksspiel. Der andere betreibt ein System.

Stufe fünf: Das Dashboard

Die sichtbare Ebene. Alles darüber wird in einer Ansicht gerendert.

Oben auf dem Bildschirm: das heutige Token-Budget für alle Modelle, mit den aktuellen Kosten für den Monat und einer Prognose für das Monatsende. Eine zweite Zeile: aktive Sitzungen, Fähigkeiten in der Warteschlange, Zeitstempel des letzten Traumberichts. Eine dritte Reihe: Rangliste für den Fertigkeits-ROI, Top 5 nach Nettoverdienst diese Woche, mit der Option, einen Drilldown zu jedem dieser Punkte durchzuführen.

Ein Seitenbereich für den Speicherzustand: veraltete Einträge, Anzahl der Widersprüche, letztes Konsolidierungsdatum. Ein Seitenbereich für Kosteninformationen: Cache-Trefferrate, durchschnittliche Kontextgröße, Prozentsatz der Anrufe, die mit dem optimalen Modell ausgeführt werden. Ein Seitenbereich zum Scannen von Chancen: Neue Tools, die Ihnen die Dream Engine zum Ausprobieren vorschlägt, basierend auf der Arbeit, die Sie diesen Monat tatsächlich geleistet haben, und nicht basierend auf dem X-Beitrag, den Sie mit einem Lesezeichen versehen haben.

Dies ist der Teil von Jacks Video, der mich aus meinem Stuhl gerissen hat. Denn das Dashboard ist nicht der Punkt. Das Dashboard ist das Artefakt, das beweist, dass das Betriebssystem darunter tatsächlich funktioniert. Sie können alles andere erstellen und es unsichtbar funktionieren lassen. Sie erstellen das Dashboard so, dass es eine Seite gibt, auf die Sie verweisen können, wenn etwas nicht mehr funktioniert – oder wenn ein Kunde Sie bittet, zu erklären, wofür Sie bezahlen.

Für die Gründerseite meiner Arbeit ist diese Seite der Unterschied zwischen „wir verwenden AI“ und „wir betreiben AI“.

Was das für die Art und Weise bedeutet, wie ich meine Crew leite

An dieser Stelle zwang mich Jacks Darstellung dazu, Annahmen zu überdenken, die ich nicht mehr in Frage gestellt hatte.

Ich schreibe seit einem Jahr über meinen Stack. Der Beitrag zum dreischichtigen Agenten-Betriebssystem behandelt Architektur, Speicher und Beobachtbarkeit – die Grundlagen, auf denen das visuelle Betriebssystem basiert. Der Beitrag zu meinem AI-Stack 2026 deckt die S/A/B/C-Stufensortierung ab, die ich auf Werkzeugen ausführe. Der MCP install/cut Beitrag deckt die Kostenschicht auf Protokollebene ab. Alle drei waren damals ehrlich. Keiner von ihnen beantwortete die Frage, zu der Jacks Video mich zwang.

Die Frage: Optimiere ich im völlig falschen Rahmen?

Seit einem Jahr optimiere ich Stück für Stück Fertigkeiten, Agenten, MCPs, Eingabeaufforderungen und Speicherebenen. Aria wird besser. Der Skills-Ordner wächst. Die Supabase-Protokolle sammeln sich an. Jede einzelne Entscheidung ist fundiert. Aber es gibt keine Oberfläche, auf der das System auf sich selbst schauen und sagen kann: „Das Ganze ist von seinem Zweck abgewichen.“ Keine Oberfläche, auf der ich das Ganze betrachten und sagen kann: „Diese Säule ist totes Gewicht“, ohne einen Nachmittag damit zu verbringen, Baumstämme zu durchsuchen.

Das visuelle Betriebssystem ist diese Oberfläche. Nicht weil Dashboards magisch sind, sondern weil ein System ohne eine Selbstansicht sich nicht selbst verbessern kann. Träumen ist der Abschluss. Der Agent liest seine eigene Arbeit, findet seine eigenen Muster, bringt seine eigenen Widersprüche zum Vorschein. Das Dashboard ist nur das Fenster in diese Schleife für den Menschen, der die Organisation leitet.

Das gibt den nächsten sechs Monaten meiner Arbeit einen besonderen Rahmen.

Der Kompetenzordner ist kein Schrank, sondern ein Dienstplan

Für jede Aria-Fertigkeit ist bis zum Ende des zweiten Quartals eine angehängte ROI-Nummer erforderlich. Ich weiß nicht, was die meisten verdienen. Das ist inakzeptabel, da die Instrumente zur Messung vorhanden sind. Die erste konkrete Aktion, die dieser Beitrag für mich generiert: ein skill-audit-Slash-Befehl, der jeden Freitag ausgeführt wird, Aufrufzahlen und Token-Ausgaben pro Skill von Supabase abruft und einen Markdown-Bericht in einen ~/audits/skills/-Ordner schreibt, damit die Dream-Schleife ihn lesen kann.

Das Cost-Intelligence-Modul ist der günstigste Gewinn

Ich kenne meine Cache-Trefferquote wirklich nicht. Ich weiß, dass Anthropic sofortiges Caching mit bis zu 90 % Ersparnis bei zwischengespeicherten Eingabe-Tokens ausgeliefert hat. Ich weiß, dass ich die Systemaufforderung von Aria so gestaltet habe, dass sie Cache-freundlich ist. Ich habe es nicht validiert. Das visuelle Betriebssystem erzwingt diese Validierung, indem es die Nummer auf dem Bildschirm anzeigt.

Der Bau dieses Teils ist ein Wochenendprojekt. Es spart vom ersten Tag an Geld. Es gibt keinen Grund, es nicht zu tun.

Auf der Traumebene höre ich auf, klug zu sein

Dies ist der Teil, gegen den ich im März argumentiert hätte. „Ich kenne meinen Arbeitsablauf. Ich brauche keinen automatischen Vorschlag, der mir sagt, was ich tun soll.“ Ich habe mich geirrt. Die Muster, die die Traumschleife zum Vorschein bringen wird, sind Muster, die ich buchstäblich nicht sehen kann, weil ich mich in ihnen befinde. Die Harvey 6x-Abschlussrate ist keine Marketingzahl – sie ist ein richtungsweisendes Signal dafür, dass die Mustererkennung durch einen zweiten Agenten ein wesentlich leistungsfähigeres Werkzeug ist als die Musterfindung durch den Menschen, der die Muster generiert.

Ich werde Managed Agents-Zugriff für die echte Version anfordern. Während ich warte, schreibe ich meinen eigenen Traum-Skill, der jede Nacht auf den Supabase-Protokollen läuft und denselben Bericht ausgibt, den die Anthropic-Version erstellt. Es wird schlimmer sein. Es wird immer noch nichts schlagen.

Der Opportunity-Scan macht dies für Kunden wertvoll

Hier ist der Winkel, den ich nicht erwartet hatte. Das visuelle Betriebssystem ist nicht nur für mich nützlich. Es eignet sich als Liefergegenstand für die Art von Agenturarbeit, die ich über ramlit.com erledige. Ein kleines Unternehmen kann es sich nicht leisten, seinen AI-Stack so zu gestalten, wie ich meinen herausgefunden habe – indem ich für 43 Tools bezahlt und stillschweigend 34 davon lösche. Ein Dashboard, das sie durch die Modellerkennung, die Speichereinrichtung, die Zeitwertdefinition und einen ersten Traumbericht führt, ist das Onboarding-Asset mit der höchsten Hebelwirkung, das ich einem Kunden geben kann. Es komprimiert ein Jahr meines Lernens auf einen Dienstagnachmittag.

Das ist der Schritt, den ich erst sah, als ich Jacks Video sah. Das visuelle Betriebssystem ist eine Produktoberfläche, nicht nur ein persönliches Werkzeug.

Die ehrlichen Kompromisse

Bevor ich irgendjemandem davon verkaufe, möchte ich die Dinge nennen, die ich zurückweisen würde, wenn mir ein Freund dieses Video empfehlen würde.

Das Dashboard ist eine Wartungsverbindlichkeit. Jede Ebene, die Sie visualisieren, ist eine Ebene, die unterbrochen wird, wenn sich ein Upstream-API ändert. Anthropische Schiffe schnell. Pinecone wird schnell versendet. Higgsfield wird schnell versendet. Sie werden mehr als null Zeitaufwand für die Entwicklung der Panels aufwenden. Wenn Sie ein Einzelunternehmer sind, muss diese Zeit irgendwo herkommen. Der Nutzen muss die Kosten ausgleichen. Für mich, mit mehr als 250 Beiträgen pro Jahr und vier Marken, ist das der Fall. Für jemanden, der sechs Posts pro Jahr verschickt, ist das wahrscheinlich nicht der Fall.

Träumen ist nicht unfehlbar. Die Traumberichte des ersten Monats enthalten schlechte Vorschläge. Es schlägt Fähigkeiten vor, die Sie nicht benötigen. Gedächtniskonsolidierungen, die an Nuancen verlieren. Kostenflags, denen der Kontext fehlt. Das Betriebssystem ist kein Entscheidungsträger – es ist ein Kandidatengenerator. Sie müssen noch die Berichte lesen und auswählen. Wenn Sie die Beurteilung auslagern, werden Sie schneller schlechtere Entscheidungen treffen.

Das 1M-Kontextfenster ist eine Versuchung, kein kostenloses Mittagessen. Nur weil Sonnet 4.6 und Opus 4.7 eine 900.000-Token-Eingabe zum Standardpreis akzeptieren, heißt das nicht, dass Sie eine senden sollten. Der neue Opus 4.7-Tokenizer kann bis zu 35 % mehr Token für denselben Eingabetext produzieren – das ist eine echte Kostensteigerung unter dem Deckmantel eines Preisstopps. Das Betriebssystem sollte Sie warnen, wenn eine Sitzung im Begriff ist, sich aufzublähen, und Sie nicht dazu ermutigen, alles in den Kontext zu verschieben, weil das Fenster es zurückhalten kann.

Zentralisierung hat einen Fehlermodus. Wenn das visuelle Betriebssystem zur einzigen Oberfläche wird, der Sie vertrauen, ist der Tag, an dem es kaputt geht, der Tag, an dem Sie nicht mehr arbeiten können. Halten Sie Ihre Fähigkeiten, Ihren Obsidian-Tresor und Ihre Supabase-Rohdaten auch ohne Dashboard zugänglich. Das Dashboard ist eine Ansicht, keine Datenbank. Wenn Sie diese Unterscheidung verlieren, haben Sie das Lock-in-Problem, dem Sie entkommen wollten, erneut aufgebaut.

Das brauchen Sie nicht am ersten Tag. Die meisten Bauherren, die diesen Beitrag lesen, müssen zuerst die Layer-1-Architektur fertigstellen. Ordner „Fähigkeiten“. CLAUDE.md. Ein oder zwei funktionierende Subagenten. Das visuelle Betriebssystem ist Schicht vier oder fünf eines Stapels, der auf den Schichten eins bis drei stehen muss, um einen Sinn zu ergeben. Bauen Sie den Boden, bevor Sie sich Gedanken über die Decke machen.

Das heißt. Die Decke ist jetzt sichtbar. Und der Traum der anthropischen Schifffahrt am 6. Mai brachte die Decke etwa einen Fuß näher als am Tag zuvor.

Was ich diese Woche mache

Konkrete Maßnahmen in der Reihenfolge:

Fordern Sie Zugriff auf die Vorschau der Traumforschung von Claude Managed Agents an. Auch wenn die Genehmigung einen Monat dauert, geht der Antrag heute Abend ein. 2. Schreiben Sie den Slash-Befehl skill-audit. Ruft die Anzahl der Aufrufe, die ausgegebenen Token und das Datum der letzten Ausführung pro Fertigkeit aus meinen Supabase-Protokollen ab. Gibt jeden Freitag um 6 Uhr morgens über einen Cron-Hook einen Markdown-Bericht in ~/audits/skills/ aus. 3. Verbinden Sie ein einfaches Cost-Intelligence-Panel mit der vorhandenen claude-usage VS Code-Erweiterung, die ich bereits verwende. Cache-Trefferquote, durchschnittliche Kontextgröße pro Fertigkeit und eine Markierung, wenn eine Fertigkeit Opus für einen Job aufruft, den Haiku hätte bewältigen können. 4. Definieren Sie meinen Stundensatz in einer einzigen Konfigurationsdatei, die das Betriebssystem lesen kann. Kein bewegliches Ziel. Eine Zahl. 5.

Schreiben Sie einen v0-Traum-Skill, der jede Nacht auf den Supabase-Protokollen ausgeführt wird und die gleiche Berichtsform ausgibt, die die Traumversion von Anthropic mit verwalteten Agenten erstellt. Schlimmer als das Original. Besser als nichts. Wird dieses Wochenende verschickt.

Fünf Dinge. Keiner von ihnen erfordert ein neues Abonnement. Sie alle liefern einen messbaren Output, wenn ich die Zusammenfassung nächste Woche veröffentliche.

Wenn auch nur einer von ihnen funktioniert, wird das Dashboard unumgänglich. Wenn drei funktionieren, ist das visuelle Betriebssystem nicht länger ein von Jack erstelltes Video – es ist die Betriebsebene, auf der meine Crew läuft.

Dafür hat sich der Kaffee am Sonntagnachmittag tatsächlich gelohnt. Kein neues Werkzeug. Ein neuer Rahmen für die Werkzeuge, die ich bereits habe.

Die Chatbox war die erste AI-Schnittstelle. Die Agentenschleife war die zweite. Das visuelle Betriebssystem ist das dritte. Wir befinden uns mitten in diesem Übergang, und die Leute, die es zuerst bemerken, profitieren ein Jahr lang von steigenden Vorteilen, bevor der Rest des Marktes aufholt. Ich habe vor, einer der Menschen zu sein, die es bemerkt haben.

Das selbstgefällige Selbstvertrauen, mit dem ich diesen Beitrag begonnen habe, ist verschwunden. Was es ersetzt hat, ist nützlicher. Es handelt sich um eine To-Do-Liste.

Häufig gestellte Fragen

Was ist ein visuelles Claude Code-Betriebssystem?

Ein visuelles Claude Code-Betriebssystem ist ein einheitliches Dashboard, das jedes AI-Modell, jeden Speicher, jeden Skill und jeden Nutzungsstrom in Ihrem Claude Code-Stack in einer einzigen, sich selbst verbessernden Oberfläche verbindet. Es verfolgt die Token-Ausgaben, berechnet den Skill-ROI und betreibt eine nächtliche Träume-Engine, die Muster aufdeckt, tote Skills bereinigt und Workflow-Verbesserungen vorschlägt. Das Konzept erweitert Anthropics offiziell veröffentlichtes Dreaming-Feature (6. Mai 2026) um eine persönliche Kontrollebene.

Ist die Dreaming-Funktion derzeit tatsächlich in Claude Code verfügbar?

Die Dreaming-Funktion befindet sich derzeit in der Forschungsvorschau für Claude Managed Agents – fordern Sie den Zugriff über das Managed-Agents-Formular auf claude.com an. Die Community-Variante namens Auto Dream für Claude Code läuft lokal und konsolidiert Speicherdateien zwischen Sitzungen, bereinigt veraltete Notizen und konvertiert relative Datumsangaben in absolute. Beide wurden im Mai 2026 öffentlich ausgeliefert.

Wie viel kostet es, ein solches Claude Code-Dashboard zu betreiben?

Die Kern-Dashboard-Infrastruktur bietet fast keinen Mehrwert, wenn Sie bereits für Claude Pro Max und eine Supabase- oder Pinecone-Stufe bezahlen. Die Dreaming-Runs-Kosten betragen einen Opus 4.7-Anruf pro Nacht bei etwa 5 US-Dollar pro Million Eingabe-Tokens, plus sofortige Caching-Einsparungen von bis zu 90 %. Die meisten Builder, die dies auf einem typischen Solo-Stack betreiben, zahlen zusätzlich 5–15 $

Wie messe ich den Skill-ROI in Claude Code?

Definieren Sie Ihren Stundensatz in Dollar. Protokollieren Sie jeden Skill-Aufruf mit seiner Token-Anzahl und der ungefähren eingesparten Zeit. Multiplizieren Sie die eingesparte Zeit mit dem Stundensatz, subtrahieren Sie die Token-Kosten und geben Sie den Oberflächen-Netto-ROI pro Skill im Dashboard an. Die Eingabe des Stundensatzes ist der Schritt, den die meisten Bauunternehmer überspringen – ohne ihn ist jede andere ROI-Zahl bedeutungslos.

Sollte ich dies erstellen, bevor oder nachdem ich einen soliden Claude Code-Stack habe?

Bauen Sie es anschließend auf. Das visuelle Betriebssystem ist Schicht vier oder fünf eines Stapels, bei dem die Schichten eins bis drei (Architektur, Speicher, Beobachtbarkeit) an erster Stelle stehen müssen. Wenn Sie noch nicht über einen funktionierenden CLAUDE.md, mindestens einen benutzerdefinierten Subagenten und Fähigkeiten verfügen, die Sie tatsächlich regelmäßig aufrufen, erstellen Sie diese, bevor Sie sich mit dem Dashboard beschäftigen. Sehen Sie sich meinen Agentic OS Three-Layer Build für die Etage an, die zuerst kommt.

Lasst uns zusammenarbeiten

Möchten Sie AI-Systeme aufbauen, Arbeitsabläufe automatisieren oder Ihre technische Infrastruktur skalieren? Ich würde gerne helfen.

Fiverr (benutzerdefinierte Builds und Integrationen): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (Unternehmenslösungen): ramlit.com
ColorPark (Design & Branding): colorpark.io
xCyberSecurity (Sicherheitsdienste): xcybersecurity.io