Claude Opus 4.6 und Sonnet 4.6: Was sich wirklich geändert hat

Ich steckte mitten in einem Refactor eines Kundenprojekts -- 47 Dateien tief in einer Laravel-Monolith-Migration -- als Claude Code einfach... weitermachte. Keine Warnung wegen Abschneidung. Kein unangenehmer Abbruch mitten in einer Funktion, bei dem das Modell außer Atem gerät und man die Ausgabe manuell wieder zusammenflicken muss. Es schrieb einfach. Und schrieb. Und beendete die gesamte Service Class in einer einzigen Response.

Da habe ich die Version überprüft. Opus 4.6. Und das Standard-Output-Token-Limit war stillschweigend auf 64.000 gestiegen.

Ich hatte monatelang mit den bisherigen Standardwerten gearbeitet und ein Muskelgedächtnis für die Einschränkungen entwickelt. Komplexe Generierungen in kleinere Stücke aufteilen. Schrittweise prompten. Mentale Gerüste bauen, um an der Obergrenze vorbeizuarbeiten. Und plötzlich war die Decke drei Stockwerke höher als die Stelle, an der ich mir ständig den Kopf gestoßen hatte.

Diese eine Änderung allein hätte gereicht, um darüber zu schreiben. Aber Anthropic hörte dort nicht auf. Das Opus 4.6 und Sonnet 4.6 Update ist eines der umfangreichsten Releases, die ich vom Claude Code-Team gesehen habe -- von Token-Kapazität und Session Management über Sicherheitspatches, Leistungsoptimierung, Plugin-Architektur bis hin zu einer langen Liste von Terminal-Fixes, bei denen ich mich fragte, ob jemand meinen persönlichen Bugtracker gelesen hatte.

Hier ist meine ehrliche Aufschlüsselung von allem, was ausgeliefert wurde, was für die tägliche Arbeit wirklich wichtig ist, und den zwei Änderungen, von denen ich glaube, dass die meisten Menschen sie komplett übersehen werden.

Warum sich dieses Update anders anfühlt als frühere

Die meisten Modell-Updates fühlen sich inkrementell an. Hier eine Benchmark-Verbesserung, dort ein etwas besserer Score beim Befolgen von Anweisungen. Man liest den Changelog, nickt und geht zurück an die Arbeit, ohne irgendetwas am eigenen Workflow zu ändern.

Dieses Update zwang mich, innerhalb der ersten 48 Stunden drei Dinge an meiner Nutzung von Claude Code zu ändern. Nicht weil der alte Weg nicht mehr funktionierte -- sondern weil die neuen Fähigkeiten meine alten Muster so anfühlen ließen, als würde ich einen Sportwagen im ersten Gang fahren.

Allein die Token-Erweiterung veränderte, wie ich über Prompt Engineering für agentic Workflows nachdenke. Die Session-Verbesserungen veränderten, wie ich langfristige Projekte verwalte. Und ein Sicherheitsfix machte mich im Nachhinein nervös wegen eines Produktions-Setups, das ich seit Wochen betrieben hatte.

Ich habe sowohl Opus 4.6 als auch Sonnet 4.6 seit dem Update an realen Projekten getestet -- keine synthetischen Benchmarks, keine Spielzeugbeispiele, sondern tatsächliche Kundenarbeit und persönliche Builds. Was folgt, ist alles, was ich gelernt habe, sortiert danach, wie sehr es Ihren täglichen Workflow tatsächlich beeinflussen wird.

Beginnen wir mit der Änderung, die am meisten ausmacht.

Wie verändert 128K Token Output die Claude Code Workflows?

Die Schlagzahl: Claude Opus 4.6 hat jetzt standardmäßig 64.000 Output-Tokens pro Response. Sowohl Opus 4.6 als auch Sonnet 4.6 unterstützen eine Obergrenze von 128.000 Tokens. Und wenn Sie den Claude-Plan nutzen, können Sie auf bis zu 1 Million Tokens im Kontext zugreifen.

Das sind große Zahlen. Aber Zahlen ohne Kontext sind nur Marketing. Hier ist, was sie in der Praxis tatsächlich bedeuten.

Der alte Workflow (vor dem 64K-Standard)

Mit den bisherigen Token-Limits erforderte jede komplexe Generierung eine Choreografie. Ich teilte eine große Datei in Abschnitte auf, promptete für jeden Abschnitt einzeln und kombinierte die Ausgaben dann manuell. Datenbank-Migrationen mit über 30 Tabellen? Drei oder vier separate Prompts. Eine komplette Test Suite für eine API mit 15 Endpoints? Ich gruppierte sie in Fünfer-Batches.

Der Overhead war nicht das Prompten selbst -- es war der Kontextverlust zwischen den Prompts. Jeder neue Prompt begann leicht losgelöst vom vorherigen. Namenskonventionen drifteten ab. Import-Statements wurden dupliziert oder vergessen. Das Modell konnte das Gesamtbild nicht sehen, weil ich es durch ein Schlüsselloch fütterte.

Die neue Realität

Mit 64K als Standard und 128K als Obergrenze generiere ich komplette Service-Schichten in einzelnen Durchläufen. Letzte Woche beauftragte ich Claude Code, ein vollständiges Benachrichtigungssystem zu bauen -- die Model Class, die Migration, die Service Class, die Event Listeners, den Queue Job, den API Controller, die Form Request Validation und die PHPUnit-Tests. Ein Prompt. Eine Response. Alles intern konsistent, weil das Modell den gesamten Kontext halten konnte, ohne dass ich ihn zerschneiden musste.

Der Qualitätsunterschied ist spürbar. Wenn das Modell alles sehen kann, was es in einem einzigen Durchlauf generiert, ist der Code kohärenter. Variablennamen bleiben konsistent. Helper Methods werden wiederverwendet statt neu erfunden. Fehlerbehandlung folgt einem einzigen Muster durchgängig. Es ist der Unterschied zwischen einem Architekten, der ein Gebäude entwirft, und fünf verschiedenen Bauunternehmern, die jeweils ein Stockwerk bauen, ohne miteinander zu sprechen.

Wann 128K wirklich zählt

Sie werden die 128K-Obergrenze bei normaler konversationeller Nutzung nicht erreichen. Kritisch wird es bei agentic Workflows -- wenn Claude Code mehrere Dateien liest, eine Codebasis analysiert und Output generiert, alles innerhalb eines einzigen Context Windows. Große Monorepo-Refactors. Full-Stack Feature-Implementierungen, die gleichzeitig Frontend, Backend und Datenbankschichten berühren. Dokumentationsgenerierung, die Dutzende von Quelldateien referenzieren muss.

Ich habe letzte Woche einen Test gemacht: Claude Code auf ein Laravel-Projekt mit 340 Dateien gerichtet und es gebeten, eine vollständige API-Dokumentationsseite zu generieren. Mit den alten Limits hätte dies eine maßgeschneiderte Pipeline von aufgeteilten Operationen erfordert. Mit 128K verfügbaren Output-Tokens las der Agent die Route-Dateien, analysierte die Controller, inspizierte die Form Requests und generierte strukturierte Dokumentation, die jeden Endpoint abdeckte -- in einer einzigen Session, ohne an die Wand zu laufen.

Das 1-Million-Token-Context-Window für Claude-Plan-Nutzer geht noch weiter. Sie können ganze Codebasen in den Kontext laden und als Ganzes damit arbeiten. Ich erkunde noch die Grenzen dessen, was in dieser Größenordnung praktikabel ist, aber die ersten Ergebnisse sind vielversprechend für groß angelegte Code-Analyse und Refactoring-Aufgaben.

Aber die Token-Erweiterung ist nur die halbe Geschichte. Die Session-Verbesserungen sind es, die mich meinen Projektmanagement-Workflow komplett überdenken ließen.

Session Management: 45% schnelleres Fortsetzen und automatische Sessionnamen

Hier ist ein Workflow-Ärgernis, das ich einfach als normal akzeptiert hatte: Ich steckte tief in einer Claude Code Session, ging zum Mittagessen, kam zurück, und das Fortsetzen der Session dauerte lang genug, dass ich einen neuen Terminal-Tab öffnete und anfing, E-Mails zu checken, während ich wartete. Bei großen Sessions mit erheblichem Kontext fühlte sich das Fortsetzen träge an.

Opus 4.6 reduziert die Fortsetzungsgeschwindigkeit von Sessions um 45% und senkt den Spitzenverbrauch an Arbeitsspeicher während des Fortsetzens um bis zu 150 MB. Die Zahlen klingen abstrakt, bis man es erlebt. Meine großen Projektsessions setzen sich jetzt in der Zeit fort, die ich früher brauchte, um zu entscheiden, ob ich warten oder eine neue Session starten sollte. Die Entscheidung wird mir abgenommen -- es ist bereits zurück.

Automatische Sessionnamen veränderten, wie ich meine Arbeit organisiere

Dieser Punkt ist subtil, aber er formt meinen täglichen Workflow um. Sessions benennen sich jetzt automatisch basierend auf dem Inhalt des akzeptierten Plans. Statt einer Liste von Sessions mit Zeitstempeln oder generischen Bezeichnungen sehe ich beschreibende Namen, die mir genau sagen, was jede Session gerade tat.

Vor diesem Update hatte ich vier oder fünf gleichzeitige Sessions offen und verlor ständig den Überblick, welche den Authentifizierungs-Refactor bearbeitete, welche die API-Integration und welche die Deployment-Konfiguration. Ich schaute in jede hinein, scannte den Kontext und orientierte mich. Zehn bis fünfzehn Sekunden Reibung, Dutzende Male am Tag wiederholt.

Jetzt werfe ich einen Blick auf die Sessionliste und weiß sofort, wo alles steht. Es ist die Art von Verbesserung, die keine Schlagzeilen macht, aber echten kognitiven Overhead über einen vollständigen Arbeitstag spart.

Der umbenannte /branch-Befehl

Der /slashwalk-Befehl wurde in /slash branch umbenannt, was semantisch deutlich mehr Sinn ergibt. Man verzweigt sein Gespräch, man wandert nicht hindurch. Der alte Name wird als Alias beibehalten, damit nichts kaputtgeht, aber wenn Sie sich Muskelgedächtnis aufbauen, beginnen Sie jetzt mit /branch.

Der /copy-Befehl bekam ebenfalls ein stilles Upgrade -- er akzeptiert jetzt einen optionalen Index, um die N-te letzte Assistant-Response abzurufen, statt immer die aktuellste zu nehmen. Kleine Funktion, aber ich habe sie diese Woche schon dreimal benutzt, als ich einen früheren Codeblock brauchte, der durch Folgegespräche nach oben verschoben worden war.

Diese Session-Verbesserungen potenzieren sich gegenseitig. Schnelleres Fortsetzen bedeutet weniger Reibung beim Kontextwechsel. Automatische Sessionnamen bedeuten weniger kognitive Belastung. Bessere Copy-Befehle bedeuten weniger manuelles Scrollen. Einzeln spart jede davon Sekunden. Zusammen, über einen ganzen Tag intensiver Claude Code-Nutzung, sparen sie mir bedeutsame Stücke fokussierter Zeit.

Nun -- hier ist der Teil dieses Updates, der mich bis nach Mitternacht wach hielt, während ich eine Produktionsumgebung erneut auditierte.

Der Sicherheitsfix, den Sie jetzt verstehen müssen

Versteckt im Changelog, zwischen den auffälligen Token-Zahlen und den Qualitätsverbesserungen, steckt ein Sicherheitspatch, der mehr Aufmerksamkeit verdient, als er bekommt.

Der Fix adressiert eine Schwachstelle, bei der pre-tool-use Hooks deny-Berechtigungsregeln umgehen konnten. Einschließlich unternehmensverwalteter Einstellungen. Lassen Sie mich erklären, warum dieser Satz Sie beunruhigen sollte, wenn Sie Claude Code in einer Umgebung mit Zugriffskontrollen betreiben.

Was war tatsächlich verwundbar

Das Berechtigungssystem von Claude Code lässt Sie definieren, was der Agent tun darf und was nicht. Deny-Regeln sollen harte Grenzen sein -- wenn Sie den Zugang zu einem Verzeichnis verweigern, sollte der Agent dort weder lesen noch schreiben können. Punkt.

Die Schwachstelle bedeutete, dass pre-tool-use Hooks -- Code, der vor der Ausführung eines Tools läuft -- diese Deny-Regeln umgehen konnten. In Unternehmensumgebungen, in denen Berechtigungsregeln zentral verwaltet werden, bedeutete dies, dass die Sicherheitsgrenze nicht so solide war, wie Administratoren glaubten.

War es wahrscheinlich, dass dies versehentlich ausgenutzt wurde? Wahrscheinlich nicht. Aber in einem gezielten Szenario -- sagen wir, ein bösartiges Plugin oder ein crafted Prompt, der darauf ausgelegt ist, Daten aus einem eingeschränkten Verzeichnis zu exfiltrieren -- hätte der Bypass ausgenutzt werden können. Die Angriffsfläche existierte, und in der Sicherheit ist das, was zählt.

Die neue Allowed-Sandbox-Einstellung

Zusammen mit dem Fix führte Anthropic eine neue Allowed-Sandbox-Einstellung ein, die Lesezugriff innerhalb von Deny-Regionen mit feingranularer Kontrolle wiederherstellt. Das ist eine kluge Designentscheidung. Anstelle des binären Allow/Deny-Modells gibt es jetzt eine Zwischenstufe: "Schreiben blockieren, aber Lesen erlauben" für bestimmte Regionen.

Das ist wichtig für Workflows, bei denen Claude Code Konfigurationsdateien lesen oder auf Code in Verzeichnissen verweisen muss, in denen es absolut keine Änderungen vornehmen sollte. Zuvor gewährte man entweder vollen Zugriff (riskant) oder verweigerte jeglichen Zugriff (einschränkend). Die Sandbox-Einstellung gibt Ihnen die Präzision, die Produktionsumgebungen tatsächlich brauchen.

Der CRLF-Zeilenende-Fix

Noch ein sicherheitsrelevanter Fix, der erwähnt werden sollte: Das Write-Tool konvertiert beim Überschreiben von CRLF-Dateien nicht mehr stillschweigend Zeilenenden. Das klingt trivial, bis man damit zu tun hatte. Wenn Sie in einer gemischten Umgebung arbeiten -- Dateien mit Windows-Ursprung in einem Projekt, das auch Unix-Style-Dateien hat -- kann stille Zeilenende-Konvertierung Shell-Skripte kaputt machen, binärnahe Dateien korrumpieren und subtile Bugs erzeugen, deren Nachverfolgung Stunden dauert.

Die Tatsache, dass das Tool stillschweigend konvertierte, ohne den Benutzer zu informieren, ist das eigentliche Problem. Stille Datenmodifikation, selbst gutgemeint, untergräbt das Vertrauen in Tools. Dieser Fix stellt das Prinzip wieder her, dass das Tool genau das tun sollte, was man verlangt hat, und nichts mehr.

Wenn Sie lieber möchten, dass jemand Ihre Claude Code Sicherheitskonfiguration und Berechtigungsgrenzen für eine Produktionsumgebung auditiert, übernehme ich Security-Review-Aufträge. Was ich bisher gebaut habe, sehen Sie unter fiverr.com/s/EgxYmWD.

In Ordnung, das war der Abschnitt, der ernsthafte Aufmerksamkeit erforderte. Was folgt, ist eine Reihe von Verbesserungen, die weniger dringend sind, aber Ihre tägliche Erfahrung merklich geschmeidiger machen werden.

Leistungsverbesserungen: Tod durch tausend Millisekunden

Ich habe eine Theorie über Developer-Tooling: Die Tools, die langfristig gewinnen, sind nicht die mit den auffälligsten Features. Es sind die Tools, die Mikroreibung so konsequent eliminieren, dass man vergisst, dass Reibung jemals existiert hat. Dieses Update nagelt diese Philosophie fest.

macOS-Start: 60 Millisekunden schneller

Sechzig Millisekunden klingen unbedeutend. Sind sie nicht. Claude Code auf macOS liest Keychain-Credentials jetzt parallel statt sequentiell beim Start. Diese 60ms-Verbesserung passiert jedes einzelne Mal, wenn Sie das Tool starten. Wenn Sie Claude Code 20 Mal am Tag starten -- was ich zwischen verschiedenen Projekten, Terminal-Sessions und Tests leicht tue -- ist das über eine Sekunde tägliche Reibung weniger.

Wichtiger noch, es ist ein Signal für Engineering-Prioritäten. Das Team profiliert Startpfade und optimiert Hot Loops. Diese Disziplin kumuliert über Releases hinweg.

Speicherwachstums-Fix für lange Sessions

Dieser traf einen Nerv. Ich hatte bemerkt, dass mehrstündige Claude Code Sessions allmählich mehr Speicher verbrauchten, was schließlich meinen Laptop-Lüfter hochfahren ließ und andere Anwendungen verlangsamte. Ich hatte das macOS-Speichermanagement beschuldigt. Es stellte sich heraus, dass es ein Bug in der Sessionverwaltung von Claude Code war -- Speicher wurde während langläufiger Sessions nicht korrekt freigegeben.

Der Fix bedeutet, dass ich jetzt ganztägige Sessions laufen lassen kann, ohne die schleichende Leistungsverschlechterung, um die ich unbewusst herumgearbeitet hatte, indem ich Sessions periodisch beendete und neu startete. Ein weiterer unsichtbarer Reibungspunkt, eliminiert.

Fortschrittsmeldungen überleben die Kompaktierung

Wenn Claude Code ein Gespräch kompaktiert, um innerhalb der Kontextgrenzen zu bleiben, verschwanden Fortschrittsmeldungen. Das bedeutete, dass man während langer agentic Operationen -- mehrstufige Dateimodifikationen, komplexe Build-Prozesse -- die Übersicht verlor, was der Agent erreicht hatte, wenn die Kompaktierung mitten in einer Operation ausgelöst wurde.

Fortschrittsmeldungen bleiben jetzt durch die Kompaktierung hindurch erhalten. Sie behalten volle Transparenz über die Arbeit des Agenten, unabhängig davon, wie lange die Session läuft. Für alle, die komplexe, mehrstufige agentic Workflows betreiben, ist das der Unterschied zwischen Vertrauen und Unruhe darüber, was unter der Haube passiert.

Korrektur der Kostenverfolgung

Ein stillerer Fix: Kosten- und Token-Nutzungs-Tracking ist jetzt korrekt für API-Fallback, wenn der Non-Streaming-Modus verwendet wird. Wenn Sie Ihre API-Ausgaben verfolgt haben und die Zahlen leicht abzuweichen schienen, ist dies wahrscheinlich der Grund. Kein dramatischer Bug, aber genaues Kosten-Tracking ist wichtig, wenn man API-Budgets über mehrere Projekte verwaltet.

Diese Leistungsverbesserungen werden es in niemandes Twitter-Highlights schaffen. Aber gestapelt repräsentieren sie eine merklich bessere tägliche Erfahrung. Das Tool startet schneller, ist stabiler über lange Sessions, transparenter während Operationen und genauer in seinen Berichten.

Apropos Transparenz -- die Plugin-Tooling-Änderungen verdienen ihren eigenen Abschnitt.

Plugin-Tooling: Die Änderungen, die Plugin-Entwickler betreffen

Wenn Sie Claude Code Plugins bauen oder warten, ist dieser Abschnitt wichtig. Wenn Sie Plugins nur verwenden, die Kurzversion: Dinge sollten weniger kaputtgehen und besser validiert werden. Sie können zu den Bash-Fixes vorspringen, wenn Sie möchten. Aber ich würde empfehlen zu bleiben -- zu verstehen, wie Plugin-Tooling funktioniert, macht Sie zu einem besseren Nutzer des Ökosystems.

Bessere Validierung mit `plugin validate`

Der plugin validate-Befehl ist deutlich intelligenter geworden. Er prüft jetzt Skill-Agent- und Command-Front-Matter, scannt hooks.json auf YAML-Parsefehler und fängt Schemaverletzungen ab. Zuvor konnte man ein Plugin mit fehlerhaftem Front Matter ausliefern und das Problem erst entdecken, wenn ein Benutzer seltsames Verhalten meldete. Die Validierung fängt diese Probleme jetzt vor dem Deployment ab.

Ich habe den aktualisierten Validator gegen meine eigenen Plugins laufen lassen, und er fand zwei Probleme, von denen ich nicht wusste, dass sie existierten -- ein fehlendes Feld im Front Matter eines Skills und eine hooks.json mit einem subtilen YAML-Einrückungsfehler. Beide funktionierten in der Praxis "einwandfrei", waren aber technisch fehlerhaft. Die Art von stiller technischer Schuld, die irgendwann zum ungünstigsten Zeitpunkt Probleme verursacht.

Verhaltensänderung der Agent Tool

Diese erfordert Aufmerksamkeit, wenn Sie programmatisch mit Agent Tools arbeiten. Die Agent Tool akzeptiert keinen Resume-Parameter mehr. Stattdessen senden Sie, um einen gestoppten Agenten fortzusetzen, eine Nachricht mit der Agent-ID. Der Agent setzt dann automatisch fort, anstatt einen Fehler zu werfen.

Das alte Verhalten war frustrierend: Wenn ein Agent stoppte und man versuchte, ihn mit dem falschen Parameterformat fortzusetzen, erhielt man einen Fehler, anstatt dass der Agent einfach dort weitermachte, wo er aufgehört hatte. Der neue Ansatz ist nachsichtiger und intuitiver. Agenten, die stoppen, können durch einfaches Ansprechen fortgesetzt werden, was dem entspricht, wie man die Interaktion natürlich erwarten würde.

Monorepo Plugin-Cache-Fix

Für Teams, die in Monorepos mit mehreren Plugins in verschiedenen Unterverzeichnissen arbeiten, gab es ein Kollisionsproblem im Plugin-Cache. Zwei Plugins in benachbarten Verzeichnissen konnten den gecachten Zustand des jeweils anderen stören. Das ist jetzt behoben -- jedes Plugin bekommt seinen eigenen Cache-Scope unabhängig von der Verzeichnisstruktur.

Das ist ein Nischen-Fix, aber wenn Sie davon betroffen waren, kennen Sie den Schmerz. Intermittierendes Plugin-Verhalten, das davon abhängt, welches Plugin zuerst geladen wurde, Cache-Invalidierung, die falsch kaskadiert -- das Debuggen dieser Probleme ist miserabel. Der Fix eliminiert eine ganze Kategorie von "Funktioniert auf meinem Rechner"-Problemen in Monorepo-Setups.

Das Plugin-Ökosystem reift. Bessere Validierung, nachsichtigeres Agent-Verhalten und Cache-Isolation sind alles Zeichen dafür, dass das Tooling für ernsthaften Produktionseinsatz gebaut wird, nicht nur für Demos und Experimente.

Sprechen wir nun über die Fixes, die am nächsten an der Stelle leben, wo Ihre Finger auf die Tastatur treffen.

Bash- und Terminal-Fixes: Das unspektakuläre Zeug, das am meisten zählt

Ich werde mehr Zeit für diesen Abschnitt aufwenden, als Sie vielleicht erwarten, weil Terminal-Verhalten dort ist, wo ich meine tatsächlichen Arbeitsstunden verbringe. Ein Modell kann brillant sein, aber wenn die Terminal-Schicht zwischen mir und dem Modell Reibung hat, leidet jede Interaktion darunter.

Zusammengesetzte Befehle funktionieren endlich richtig

Dieser Fix adressiert etwas, das mich wochenlang still geärgert hatte. Wenn man Befehle verkettete -- wie cd gefolgt von npm test -- speicherte Claude Code manchmal die Berechtigungsregel für den gesamten kombinierten String, anstatt jeden Befehl unabhängig zu behandeln. Das bedeutete, man genehmigte cd /project && npm test einmal, und später, wenn man nur npm test separat ausführte, galt die gespeicherte Berechtigung nicht, weil sie gegen den zusammengesetzten String gespeichert war.

Jetzt wird jeder Befehl in einer Kette unabhängig ausgewertet. Genehmigen Sie npm test einmal, und es bleibt genehmigt, ob Sie es allein oder als Teil einer Kette ausführen. Das entspricht dem, wie man intuitiv erwarten würde, dass Berechtigungen funktionieren, und eliminiert eine Quelle von "Warum fragt es mich schon wieder?"-Reibung.

Das 5-GB-Kill für Hintergrundaufgaben

Außer Kontrolle geratene Hintergrund-Bash-Tasks, die mehr als 5 GB Output erzeugen, werden jetzt korrekt beendet. Ich gebe zu -- ich wusste nicht, dass das ein Problem war, bis ich den Changelog las und an eine Session vor zwei Wochen zurückdachte, in der mein Terminal während eines besonders gesprächigen Build-Prozesses nicht mehr reagierte. Ansammlung von Hintergrundausgaben war wahrscheinlich der Übeltäter.

Der Schwellwert von 5 GB ist großzügig genug, dass kein legitimer Prozess ihn auslösen sollte, aber eng genug, um zu verhindern, dass eine entlaufene Aufgabe den gesamten verfügbaren Speicher verbraucht. Guter Standardwert.

Leerzeichen in temporären Verzeichnispfaden

Bash meldet nicht mehr falsche Fehler für erfolgreiche Befehle, wenn temporäre Verzeichnispfade Leerzeichen enthalten. Das ist eine klassische Unix-Falle -- Pfade mit Leerzeichen brechen Annahmen in Shell-Skripten überall, und die internen temporären Verzeichnisse von Claude Code lösten das gleiche Problem aus. Wenn Sie jemals eine Fehlermeldung nach einem Befehl gesehen haben, der offensichtlich erfolgreich war, erklärt dieser Fix es möglicherweise.

Einfüge-Erhaltung

Eingefügter Inhalt bleibt jetzt erhalten, wenn man sofort nach dem Einfügen zu tippen beginnt. Vor diesem Fix konnte man, wenn man einen Textblock einfügte und zu tippen begann, bevor das Einfügen vollständig registriert war, einen Teil des eingefügten Inhalts verlieren. Der Fix betrifft die Eingabepuffer-Behandlung -- sicherzustellen, dass Einfüge-Events abgeschlossen sind, bevor Tastatur-Events verarbeitet werden.

Kleiner Fix. Aber den Inhalt der Zwischenablage mitten im Workflow zu verlieren, ist die Art von Ding, bei dem man seinen eigenen Verstand in Frage stellt, bevor man das Tool in Frage stellt.

Visual-Mode-Fixes im Terminal

Backspace und Delete funktionieren jetzt korrekt im Visual Normal Mode (vnormal). Die Statusleiste aktualisiert sich korrekt, wenn der Visual Mode umgeschaltet wird. Nummerierte Listen werden korrekt dargestellt. CJK-Zeichen bluten nicht mehr in angrenzende UI-Elemente am rechten Rand.

Das sind Polier-Fixes, aber sie sind wichtig für alle, die hauptsächlich im Terminal arbeiten. CJK-Zeichendarstellung betrifft insbesondere eine riesige Anzahl von Entwicklern weltweit -- wenn Zeichen in benachbarte UI-Elemente hineinragen, ist das nicht nur hässlich, es macht die Oberfläche visuell schwerer zu erfassen.

Tmux- und SSH-Verbesserungen

Die Tmux-Fixes verdienen eine besondere Erwähnung, weil viele Entwickler -- mich eingeschlossen -- in Tmux-Sessions leben. Hintergrundfarben werden jetzt mit der Standard-Tmux-Konfiguration korrekt dargestellt. Keine Abstürze mehr beim Auswählen von Text in Tmux über SSH. Clipboard Copy zeigt eine hilfreiche Toast-Benachrichtigung darüber, ob man mit Cmd-Y oder dem Tmux-Prefix einfügen soll. IDE-Integration verbindet sich automatisch, wenn Claude Code innerhalb von Tmux oder Screen gestartet wird.

Der letzte Punkt ist besonders willkommen. Ich hatte die IDE-Integration jedes Mal manuell neu verbunden, wenn ich Claude Code aus Tmux heraus startete. Die automatische Verbindung eliminiert einen Schritt, den ich so gewohnheitsmäßig ausführte, dass ich die Reibung nicht mehr bemerkte -- bis sie verschwand.

IDE-Integration: Kleine Fixes, große Lebensqualität

Einige IDE-Verbesserungen runden das Update ab. Tab-Titel für Planvorschauen verwenden jetzt die tatsächliche Überschrift des Plans statt eines generischen "Claude plan"-Labels. Das ist die gleiche Philosophie wie bei automatischen Sessionnamen -- dem Benutzer Informationen auf einen Blick geben, anstatt ihn zum Durchklicken zu zwingen, um sich zu orientieren.

Hyperlinks öffnen sich bei Cmd-Klick in VS Code, Cursor und anderen xterm.js-basierten Terminals nicht mehr doppelt. Wenn Sie mit doppelten Browser-Tabs zu kämpfen hatten, jedes Mal wenn Sie auf einen Link im Terminal klickten, das war ein bekannter Bug, und er ist jetzt behoben.

Der Footer verlinkt jetzt auf die macOS-Einstellung zum Erzwingen der Auswahl mit Option-Klick, wenn die native Auswahl nicht ausgelöst wird. Ein kleines UX-Detail, aber es zeigt, dass das Team über die gesamte User Journey nachdenkt -- einschließlich der Momente, in denen jemand durch das macOS-Eingabeverhalten verwirrt wird und die richtige Systemeinstellung finden muss.

Was die meisten Menschen an diesem Update übersehen werden

Hier ist meine ehrliche Einschätzung nach zwei Wochen täglicher Nutzung mit diesen Änderungen.

Die meiste Berichterstattung über dieses Update wird sich auf die Token-Zahlen konzentrieren. 64K Standard. 128K Obergrenze. 1 Million Kontext. Das sind beeindruckende Zahlen, und sie verändern aufrichtig, was möglich ist. Aber sie sind auch die am einfachsten zu verstehenden Verbesserungen und die am schwersten falsch einzusetzenden -- mehr Tokens ist schlicht besser.

Die Änderungen, von denen ich glaube, dass sie langfristig die größte Wirkung haben werden, sind die, die am schwersten in eine Überschrift zu fassen sind.

Der Sicherheitsfix ist wichtiger als die Token-Erweiterung für jeden, der Claude Code in einer Team- oder Produktionsumgebung betreibt. Berechtigungs-Bypasses sind die Art von Schwachstelle, die das Vertrauen in Tooling untergräbt, und Vertrauen ist das Fundament, auf dem alles andere aufgebaut ist. Wenn Sie Claude Code Deployments verwalten, überprüfen Sie Ihre Deny-Regeln und bestätigen Sie, dass der Patch angewendet ist.

Die Session-Management-Verbesserungen -- automatische Sessionnamen, schnelleres Fortsetzen, persistente Fortschrittsmeldungen -- kumulieren zu einer grundlegend anderen Arbeitserfahrung über Wochen und Monate. Sie reduzieren die kognitive Steuer der Tool-Nutzung, was bedeutet, dass mehr Ihrer mentalen Energie in das eigentliche Problem fließt, das Sie lösen, anstatt in die Verwaltung des Tools selbst.

Und die Bash- und Terminal-Fixes repräsentieren etwas, das ich bei Engineering-Teams zutiefst schätze: die Bereitschaft, das Langweilige zu reparieren. Einfügepuffer-Behandlung. Pfad-Leerzeichen. CJK-Darstellung. Speicherung von Berechtigungsregeln für zusammengesetzte Befehle. Nichts davon wird auf Twitter trenden. Alles davon macht das Tool vertrauenswürdiger für den täglichen professionellen Einsatz.

Wie Sie jetzt das Beste aus Opus 4.6 herausholen

Wenn Sie schon eine Weile mit Claude Code arbeiten, hier ist, was ich empfehlen würde, diese Woche zu tun, um vom Update zu profitieren.

Erstens, überdenken Sie jeden Workflow, bei dem Sie Prompts wegen Output-Limits in Stücke geteilt haben. Versuchen Sie, sie jetzt als einzelne Prompts auszuführen. Sie werden wahrscheinlich feststellen, dass der 64K-Standard Operationen bewältigt, die Sie manuell aufgeteilt hatten, und die Output-Qualität verbessert sich durch den einheitlichen Kontext.

Zweitens, überprüfen Sie Ihre Berechtigungskonfiguration. Besonders wenn Sie sich in einer Unternehmensumgebung befinden oder benutzerdefinierte Deny-Regeln haben. Stellen Sie sicher, dass der Sicherheitspatch angewendet ist, und testen Sie Ihre Grenzen. Die neue Sandbox-Einstellung gibt Ihnen feingranulare Kontrolle -- nutzen Sie sie, um zu breite Allow/Deny-Regeln durch präzises Scoping zu ersetzen.

Drittens, lassen Sie automatische Sessionnamen für sich arbeiten. Wenn Sie Sessions manuell organisiert oder auf Zeitstempel vertraut haben, um zu verfolgen, welche Session welches Projekt bearbeitet, hören Sie damit auf. Lassen Sie die Autonamen-Funktion das übernehmen und richten Sie die Organisationsenergie auf die eigentliche Arbeit.

Viertens, wenn Sie in Tmux arbeiten, testen Sie das Autoconnect-Verhalten. Wenn Sie die IDE-Integration manuell verbunden haben, verifizieren Sie, dass die automatische Verbindung in Ihrem Setup funktioniert. Verschiedene Tmux-Konfigurationen könnten unterschiedlich auf Autoconnect reagieren -- besser, eventuelle Grenzfälle jetzt zu entdecken als während einer Deadline.

Fünftens, lassen Sie plugin validate gegen alle Plugins laufen, die Sie warten. Die erweiterte Validierung fängt Probleme ab, die der alte Validator übersehen hat. Beheben Sie sie, bevor Ihre Benutzer sie in der Produktion entdecken.

Das Opus 4.6 und Sonnet 4.6 Update ist kein einzelnes Flaggschiff-Feature in Marketing verpackt. Es sind hundert kleine bis mittlere Verbesserungen, die zusammen Claude Code zu einem merklich besseren Tool machen, als es vor zwei Wochen war.

Und ehrlich gesagt? Die Verbesserungen, über die ich mich am meisten freue, sind die, die Reibung entfernten, die ich nicht mehr bemerkt hatte. Die Session-Fortsetzungsgeschwindigkeit, die ich als normal akzeptiert hatte. Das Einfügepuffer-Problem, das ich meiner Tastatur angelastet hatte. Den Tmux-Neuverbindungsschritt, den ich in meinem Kopf automatisiert hatte. Wenn ein Tool Reibung entfernt, an die man sich angepasst hatte, wird es nicht nur besser -- es lässt einen erkennen, wie viel kognitiven Overhead man stillschweigend mitgetragen hat.

Das ist die Art von Update, über die es sich zu schreiben lohnt.

Was ist das Erste, das Sie mit 128K Output-Tokens ausprobieren werden? Ich habe ein paar Experimente in der Warteschlange, die ich teile, sobald die Ergebnisse vorliegen. Meine Wette ist, dass der Sweet Spot für die meisten Entwickler nicht die maximale Token-Zahl ist -- sondern irgendwo bei 40-50K liegt, wo man einheitlichen Kontext bekommt ohne die Latenz einer wirklich massiven Generierung. Aber ich lag schon falsch, und ich freue mich darauf, es herauszufinden.

Häufig gestellte Fragen

Was ist das Standard-Output-Token-Limit für Claude Opus 4.6?

Claude Opus 4.6 hat standardmäßig 64.000 Output-Tokens pro Response, mit einer Obergrenze von 128.000 Tokens. Claude-Plan-Nutzer haben Zugriff auf bis zu 1 Million Tokens im Kontext. Für eine vollständige Aufschlüsselung, wie dies reale Workflows verändert, siehe den Abschnitt über Token-Output oben.

Bekommt Sonnet 4.6 die gleichen Token-Verbesserungen wie Opus 4.6?

Sowohl Sonnet 4.6 als auch Opus 4.6 unterstützen die Obergrenze von 128.000 Tokens für Output. Die Session-Management-Verbesserungen, Sicherheitspatches und Terminal-Fixes gelten gleichermaßen für beide Modelle. Der Hauptunterschied bleibt die stärkere Leistung von Opus bei komplexen Reasoning-Aufgaben.

Wie viel schneller ist das Fortsetzen von Claude Code Sessions nach diesem Update?

Die Fortsetzungsgeschwindigkeit von Sessions hat sich um 45% verbessert, mit bis zu 150 MB weniger Spitzen-Speicherverbrauch beim Fortsetzen. Sessions benennen sich auch automatisch basierend auf dem Planinhalt, was es schneller macht, die richtige Session zu finden und fortzusetzen.

Ist die Sicherheitslücke bei pre-tool-use Hooks ernst?

Die Schwachstelle ermöglichte es pre-tool-use Hooks, deny-Berechtigungsregeln zu umgehen, einschließlich unternehmensverwalteter Einstellungen. Obwohl es unwahrscheinlich ist, dass dies versehentlich ausgelöst wird, schuf es eine reale Angriffsfläche in Umgebungen mit Zugriffskontrollen. Der Patch sollte sofort in jedem Team- oder Produktions-Deployment angewendet werden.

Was hat sich bei der Claude Code Plugin-Validierung geändert?

Der plugin validate-Befehl prüft jetzt Skill-Agent- und Command-Front-Matter, hooks.json auf YAML-Parsefehler und Schemaverletzungen. Agent Tools setzen auch automatisch fort, anstatt bei Fortsetzung einen Fehler zu werfen. Für die vollständigen Plugin-Änderungen siehe den Abschnitt über Plugin-Tooling oben.

Lassen Sie uns zusammenarbeiten

Sie möchten KI-Systeme aufbauen, Workflows automatisieren oder Ihre technische Infrastruktur skalieren? Ich helfe Ihnen gerne.

Fiverr (Individuallösungen & Integrationen): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (Enterprise-Lösungen): ramlit.com
ColorPark (Design & Branding): colorpark.io
xCyberSecurity (Sicherheitsdienste): xcybersecurity.io