Codex entwickelt sich still und leise zum Consumer Agents
Ich habe Codex an einem Mittwochmorgen geöffnet und erwartete, Code zu schreiben. Ich schloss es drei Stunden später, nachdem ich ein Foliendeck entworfen, mein Slack geprüft, einen Arbeitsablauf in eine schriftliche SOP abgebildet hatte und beobachtete, wie sich ein kleiner virtueller Cursor durch meinen Browser bewegte wie ein höflicher Praktikant mit zu viel Koffein. Ich hatte keine einzige Zeile Code geschrieben.
Das ist der Teil, über den niemand spricht.
Codex – das gleiche Produkt, das laut den eigenen Zahlen von OpenAI im April 2026 3 Millionen wöchentlich aktive Entwickler für die Agentencodierung verwendeten – verändert sich. Nicht laut. Nicht mit einem Rebranding. Nur eine stetige, fast verdächtige Reihe von Updates, die in eine ganz andere Richtung weisen als die, die die Entwickler-Community liest. Die Veröffentlichung „Background Computer Use“ am 16. April 2026 war das Naheliegendste. Aber die Eingabeaufforderungen, die OpenAI jetzt auf der Startseite der Codex-App vorschlägt, sind der wahre Beweis. Sie sagen nicht „Diese React-Komponente umgestalten“. Sie sagen Dinge wie „Überprüfen Sie meine ungelesenen Nachrichten und bringen Sie Aktionspunkte zum Vorschein“ und „Entwerfen Sie aus diesem Protokoll eine Folienpräsentation für das morgige Meeting.“
Das ist kein Entwicklertool. Das ist ein Stabschef.
Ich habe eine Woche damit verbracht, Codex so zu verwenden, wie OpenAI eindeutig möchte, dass die nächsten 80 % seiner Verbraucherbasis es nutzen – als Desktop-Agent für nichttechnische Wissensarbeit – und ich kam mit drei Erkenntnissen, zwei starken Meinungen und einer Vorhersage heraus, auf die ich wetten möchte. Keiner davon ist derjenige, über den sich die Codex vs. Claude Code-Threads auf X gerade streiten.
Lassen Sie mich Ihnen zeigen, was ich meine.
Der stille Dreh- und Angelpunkt, den niemand ruft
Öffnen Sie noch heute die Codex-Desktop-App. Sehen Sie sich die vorgeschlagenen Eingabeaufforderungen auf dem Startbildschirm an. Dann schauen Sie sich die vorgeschlagenen Eingabeaufforderungen von vor sechs Monaten an.
Vor sechs Monaten: „Diesen fehlgeschlagenen Test beheben“, „ein Gerüst für eine Next.js-App erstellen“, „diese PR überprüfen.“ Heute: „Zusammenfassung meiner Woche aus Slack und E-Mail“, „Überprüfen Sie diesen Workflow und schlagen Sie vor, wo er automatisiert werden kann“, „füllen Sie dieses Google-Formular mit den Daten in meinem Laufwerk aus.“ Der MCP-Server-Jargon verschwindet von der Primäroberfläche. Wenn Sie nachsehen, gibt es immer noch Git-Umgebungsschalter, aber sie sind nicht das, was neue Benutzer zuerst sehen. Bei der ersten Ausführung werden Sie durch die Aktivierung des Browserzugriffs und die Verbindung mit Gmail geführt. Kein Repo.
Dies ist eine bewusste Neupositionierung, und die strategische Logik dahinter wird deutlich, wenn man sie laut ausspricht. Weltweit gibt es etwa 30 Millionen Softwareentwickler. Die weltweite Bevölkerung der Wissensarbeiter – also jeder, dessen Hauptaufgabe darin besteht, vor einem Computer zu sitzen und Informationen zu übertragen – liegt bei etwa einer Milliarde. Wenn Sie das beste Agenten-Codierungstool der Welt entwickeln, liegt Ihre Obergrenze bei 30 Millionen Sitzplätzen. Wenn Sie für alle anderen einen kompetenten Agenten-Stabschef aufbauen, liegt Ihre Obergrenze um zwei Größenordnungen höher.
Codex codiert immer noch gut. Mit GPT-5.5-Codex im Pro-Plan, den ich verwendet habe, erhalten Sie etwa 600 bis 3.000 lokale Nachrichten und 200 bis 1.200 Cloud-Aufgaben alle fünf Stunden. Das ist enormer Headroom. Aber der neue Funktionsstapel – Desktop-Steuerung, Browser-Automatisierung, image generation, Dateianalyse, Plugin-Konnektoren – wurde nicht in erster Linie für Entwickler entwickelt. Entwickler verfügten bereits über Terminals, IDEs und CLIs. Der neue Stapel wurde für die Person erstellt, die über sechs Gmail-Registerkarten, drei Notion-Dokumente, ein halbfertiges Foliendeck und einen Kalender voller Besprechungen verfügt, auf die sie sich nicht vorbereitet hat.
Ich sage nicht, dass OpenAI die Entwickleroberfläche verlassen wird. Ich sage, der Schwerpunkt hat sich verschoben, und die Codex-Updates in den nächsten zwölf Monaten richten sich an professionelle Verbraucher und nicht an Ingenieure. Beachten Sie die vorgeschlagenen Eingabeaufforderungen. Anhand der vorgeschlagenen Eingabeaufforderungen erfahren Sie immer, für wen das Produkt wirklich geeignet ist.
Lassen Sie mich Ihnen nun zeigen, was ich tatsächlich getestet habe.
Was Codex als Consumer Agent tatsächlich leisten kann – getestet
Ich habe im Laufe der Woche sechs Tests durchgeführt. Keine synthetischen Benchmarks – echte Aufgaben, die ich sonst selbst erledigt hätte, mit einer Stoppuhr und einem ehrlichen Protokoll darüber, was funktioniert hat und was nicht. Folgendes habe ich gefunden, grob geordnet von „Das verändert meine Arbeitsweise“ bis hin zu „Interessante Demo, noch nicht nützlich“.
Test 1: Der wöchentliche Brief
Die Aufforderung war fast peinlich einfach. „Schauen Sie sich mein Gmail, mein Slack und meinen Google-Kalender der letzten sieben Tage an. Geben Sie mir eine einseitige Übersicht darüber, was passiert ist, wozu ich mich verpflichtet habe, was ich den Leuten schulde und was unbeantwortet bleibt.“
Codex startete seinen Browser, navigierte zu Gmail (nachdem ich mich authentifiziert hatte), scrollte durch meinen Posteingang, öffnete Threads, die es als wichtig erachtete, wechselte zu Slack, las Kanalkopfzeilen, sprang zu meinem Kalender und dann – und das ist der Teil, der für mich etwas verändert hat – hielt es an und stellte eine klärende Frage. „Soll ich Direktnachrichten von Personen außerhalb Ihrer Organisation einschließen oder nur interne Threads?“
Diese Frage unterscheidet einen Chatbot von einem Agenten. Ein Chatbot errät. Ein Agent erkennt, dass die Spezifikation nicht eindeutig ist und fragt nach, bevor er die nächsten zwölf Minuten damit verbringt, das falsche Artefakt zu produzieren.
Achtzehn Minuten nachdem ich die Aufforderung gegeben hatte, hatte ich einen einseitigen Brief, der meine Woche wirklich festhielt. Drei Dinge, die ich vergessen hatte und zu denen ich mich verpflichtet hatte. Zwei Threads, auf die ich Antworten schuldete. Ein Treffen, auf das ich mich nicht vorbereitet hatte. Ich habe diese Übung schon einmal manuell durchgeführt. An einem Freitagnachmittag brauche ich ungefähr neunzig Minuten, und ich mache immer Abstriche. Codex hat es in achtzehn Jahren geschafft, und die Abstriche, die es gemacht hat, waren diejenigen, die ein kompetenter menschlicher Stabschef auch abschneiden würde – die trivialen Threads, die Marketing-E-Mails, der Kalender ohne Agenda.
Dies ist der Anwendungsfall, der mich bekehrt hat. Wenn Sie diese Woche nichts anderes mit Codex tun, tun Sie dies.
Test 2: Browsersteuerung vs. Claude in Chrome
Ich teste seit Monaten [Claude in Chrome zusammen mit Es ist gut in der bewussten, sorgfältigen, mehrstufigen Navigation. Es neigt dazu, zu viel nachzudenken, macht aber selten einen destruktiven Fehler.
Codexs browser control ist anders. Es läuft in einem In-App-Browser und nicht als Erweiterung Ihrer echten Chrome-Sitzung, wodurch sich das Vertrauensmodell sofort ändert – Sie geben Codex ein eigenes Sandbox-Fenster und lassen keinen Agenten auf den Tab los, in dem Sie Ihre Bank geöffnet haben. Der Cursor bewegt sich sichtbar und schnell. Laut dem öffentlichen Codex-Änderungsprotokoll und der Ankündigung von OpenAI vom April 2026 ist die Browseroberfläche Teil desselben Stacks für die Hintergrundcomputernutzung, mit dem Codex macOS-Apps nativ betreiben kann.
Ich gab beiden Agenten die gleiche Aufgabe: „Finden Sie den günstigsten Direktflug von Dhaka nach Singapur zwischen dem 14. und 18. Juni 2026 und machen Sie einen Screenshot des Ergebnisses.“
Claude in Chrome öffnete Google Flights, fummelte zweimal an der Datumsauswahl herum (es wurde ständig versucht, etwas in das Feld einzugeben, anstatt auf den Kalender zu klicken), bekam schließlich die Suche richtig und erstellte den Screenshot in etwa vier Minuten.
Codex öffnete seinen In-App-Browser, ging direkt zu Google-Flüge, klickte beim ersten Versuch richtig auf die Datumsauswahl, sortierte nach Preis und erstellte den Screenshot in knapp zwei Minuten. Die Cursorbewegung ist flüssiger. Die DOM-Inspektion fühlte sich genauer an. Ich behaupte nicht, dass Codex allgemein besser ist – der Vorteil von Claude in Chrome besteht darin, dass es in Ihrer echten Browsersitzung mit Ihren echten Cookies und Ihrem echten Anmeldestatus funktioniert, was für jede Aufgabe, die eine Authentifizierung erfordert, ein viel größeres Problem darstellt. Bei nicht authentifizierten Aufgaben im öffentlichen Web war browser control von Codex in meinen Tests jedoch sichtbar schneller und genauer.
Die ehrliche Erkenntnis: Wählen Sie den Agenten, der zu Ihrem Vertrauensmodell passt. In-App-Sandbox, wenn Sie Geschwindigkeit und Isolation wünschen. Real-Chrome-Erweiterung, wenn Sie in Ihren Konten angemeldet bleiben möchten. Es handelt sich nicht um dasselbe Produkt.
Test 3: Videodateianalyse
Dies ist der Test, bei dem die Lücke am peinlichsten war.
Ich hatte eine dreißigminütige Bildschirmaufzeichnung eines Kundengesprächs. Ich wollte den Moment finden, in dem der Kunde sagte: „Wir sollten über das Budget reden“, und einen 15-sekündigen Clip darum drehen. Zwei AI-Agenten, gleiche Aufgabe.
Claude in Chrome konnte dies nicht tun. Browserbasierte Agenten haben keinen echten Pfad zu lokalen Videodateien, es sei denn, Sie laden sie zuerst auf einen Dienst hoch, und das Computernutzungsprodukt von Anthropic umfasst derzeit keine Desktop-native Videobildanalyse. Mir wurde höflich gesagt, ich solle die Datei bei einem Transkriptionsdienst hochladen. In Ordnung, aber nicht das, was ich verlangt habe.
Codex öffnete bei aktivierter Desktop-Steuerung den Finder, navigierte zu der Datei und tat dann etwas, das mich wirklich überraschte: Es analysierte die Audiospur, um die Phrase zu finden, sprang zum Zeitstempel und produzierte den Clip mit ffmpeg, das bereits auf meinem Computer installiert war. Gesamtzeit: etwa sieben Minuten.
Ich möchte hier vorsichtig sein. Dies ist ein Test für eine Datei auf einem Computer. Ich würde nicht verallgemeinern, dass „Codex jedes Video analysieren kann.“ Aber der architektonische Unterschied ist wichtig. Nur-Browser-Agenten sind grundsätzlich auf die Weboberfläche beschränkt. Desktop-native Agents können Ihr Dateisystem lesen, lokale CLIs aufrufen und eine Brücke zu den vielen Tools schlagen, die seit einem Jahrzehnt auf Ihrem Computer vorhanden sind. Das ist ein struktureller Vorteil, den keine bessere Chrome-Automatisierung übertreffen kann.
Test 4: Entwerfen eines Foliendecks
Die Aufforderung: „Nehmen Sie dieses Besprechungsprotokoll und entwerfen Sie ein Deck mit zehn Folien, in denen die wichtigsten Entscheidungen zusammengefasst werden, mit einer Folie pro Entscheidung und einer Abschlussfolie über die nächsten Schritte.“
Codex erstellte in etwa neunzig Sekunden eine strukturierte Gliederung, öffnete dann Google Slides über seinen Browser, erstellte das Deck und füllte jede Folie. Das visuelle Design war mittelmäßig – generische Google Slides-Vorlagen, keine echte Typografiehierarchie – aber die Inhaltsstruktur war solide.
Der interessante Teil: Dann wurde gefragt: „Möchten Sie, dass ich ein Heldenbild für die Titelfolie erstelle?“ Ja, bitte. Und hier ist die zweite stille Funktion, über die niemand spricht – image generation ist jetzt direkt in Codex integriert. Kein externes Plugin, keine DALL-E-Weiterleitung, kein separater Workflow. Der image gen wurde inline mit dem gpt-image-1.5-Modell erstellt, das mit der Codex-Desktop-App geliefert wird, und auf der Titelfolie abgelegt.
Wenn Sie jemals versucht haben, diesen Workflow durch manuelles Verketten von ChatGPT-, Canva- und Google-Folien aufzubauen, wissen Sie, wie viel Reibung einfach verschwunden ist.
Test 5: Workflow-Audit und SOP-Generierung
Meiner Meinung nach ist dies die Variante, die für Kleinunternehmer und Einzelunternehmer die größten Vorteile bietet.
Ich habe Codex gefragt: „Sehen Sie mir zu, wie ich am Montagmorgen meine Content-Publishing-Routine mache. Dann schreiben Sie mir eine SOP, die eine andere Person befolgen kann.“
Ich teilte etwa zwanzig Minuten lang den Bildschirm mit dem Codex-Agenten, während ich meinen normalen Ablauf durchlief – Entwürfe aus Notion abrufen, sie in Markdown formatieren, den SEO-Header überprüfen, auf Buffer planen, meinen Inhaltskalender aktualisieren. Codex hat sich die ganze Zeit Notizen gemacht. Am Ende wurde eine 1.400 Wörter umfassende SOP mit Screenshots jedes Schritts, einer Liste der von mir verwendeten Tools, den Entscheidungen, die ich an jedem Verzweigungspunkt getroffen habe, und – was ich wirklich nicht erwartet hatte – einem Abschnitt erstellt, in dem drei Schritte aufgeführt sind, die als Kandidaten für die Automatisierung beurteilt wurden, sowie die spezifischen Toolkombinationen, die empfohlen wurden.
Zwei der drei Vorschläge hatte ich bereits in Betracht gezogen. Den dritten hatte ich nicht. Das ist der Moment, in dem ein Werkzeug aufhört, ein Werkzeug zu sein, und anfängt, ein Mitarbeiter zu sein.
Wenn Sie ein Dienstleistungsunternehmen, eine Agentur oder einen Ein-Personen-Betrieb mit wiederholbaren Arbeitsabläufen betreiben, ist diese einzelne Funktion allein das ChatGPT Plus-Abonnement für 20 US-Dollar wert. Das kommt dem Einsatz eines Betriebsberaters auf engstem Raum am nächsten.
Test 6: Formular ausfüllen
Ich habe wiederkehrende Schmerzen. Jedes Quartal muss ich die gleichen drei Formulare ausfüllen – ein Steuer-Compliance-Formular, eine Lieferanten-Onboarding-Vorlage und ein Projektaufnahmedokument. Die Daten befinden sich auf meinem Drive, meinem CRM und meinen Notizen. Ich mache es seit Jahren manuell.
Ich gewährte Codex Zugriff auf mein Laufwerk, richtete es auf die drei leeren Formulare und bat es, jedes Formular mit den neuesten verfügbaren Daten auszufüllen. Zweiundzwanzig Minuten später waren alle drei Formulare vollständig. Ich habe jedes einzelne überprüft. Zwei waren bereit, sie so einzureichen, wie sie sind. Beim dritten waren zwei Felder falsch – beide an Stellen, an denen die Quelldaten wirklich mehrdeutig waren. Ein menschlicher Assistent hätte die gleichen Anrufe getätigt.
Das Muster in allen sechs Tests: Codex glänzt bei Aufgaben, die sich über mehr als eine App erstrecken und das Lesen von einer Oberfläche zum Schreiben in eine andere erfordern. Das ist nicht das, was Codierungsagenten tun. Das ist es, was Wissensarbeiter den ganzen Tag tun.
Wie sich Codex und Claude derzeit stapeln
Hier ist die Vergleichstabelle, der ich aufgrund meiner Testwoche tatsächlich vertrauen würde. Nicht die Marketingversion. Die Version „Ich habe die gleiche Eingabeaufforderung durch beide laufen lassen und beobachtet, was passiert ist“.
| Fähigkeit | OpenAI Codex (Mai 2026) | Claude in Chrome / Computernutzung |
|---|---|---|
| In-browser control | Hervorragend geeignet für In-App-Browser mit Sandbox; schneller, präziser Cursor | Solide in echtem Chrome per Erweiterung; langsamer, nutzt aber Ihre Live-Sitzung |
| Lokale Datei-/Videoanalyse | Funktioniert – meine Bildschirmaufnahme lesen, Audio-Cue finden, Clip mit ffmpeg | schneiden In meinem Test nicht bestanden – abgelehnt und externer Upload empfohlen |
| Bilderzeugung | Integriert, inline, kein Plugin (gpt-image-1.5 / ChatGPT Images 2) | Nicht nativ in der Agentenoberfläche |
| Desktop-App-Steuerung | Nativ über Computernutzung im Hintergrund (16. April 2026) | Erhältlich über den Computer mit API, aber als Endbenutzerprodukt weniger ausgefeilt |
| UI-Ausrichtung | Übergang vom Entwickler zum Verbraucher; Es bleibt noch etwas Entwickler-Jargon | Bereits vom Start an verbraucherfreundliches UX |
| **Verbinden |
r Ökosystem** | Google Workspace, Spotify, Instacart, Booking, Blender, Photoshop, Autodesk, Ableton – 90+ Plugins pro Update vom April 2026 | Vergleichbare Connector-Bibliothek, ebenfalls wachsend | | Vertrauensmodell | Sandkastenfenster, isolierte Sitzung | Echter Browser, echte Cookies – höhere Leistungsfähigkeit, höheres Risiko | | Am besten für | Multi-App-Desktop-Aufgaben, Dateiarbeit, schnelle Automatisierung des öffentlichen Webs | Authentifizierte Arbeitsabläufe, sorgfältige Navigation, bewusste mehrstufige Aufgaben |
Die ehrliche Zusammenfassung: Es handelt sich nicht um dasselbe Produkt, und die richtige Antwort lautet nicht: „Verwenden Sie das eine oder das andere.“ Wenn Ihre Arbeit in Ihren lokalen Dateien gespeichert ist und Sie viel im öffentlichen Web recherchieren, ist Codex diesen Monat die bessere Wahl. Wenn Ihre Arbeit hinter Logins steckt und Sie einen Agenten innerhalb Ihrer echten Browsersitzung benötigen, ist Claude genau das Richtige für Sie.
Für die meisten Wissensarbeiter, die keines von beidem sind, werden das reibungslosere Onboarding und die integrierte image generation von Codex im ersten Monat der Einführung überzeugen. Das ist wichtiger als Benchmark-Siege.
Das Connector-Ökosystem ist der wahre Burggraben
Die Diskussion, die ich online immer wieder sehe, lautet: „Welcher Agent ist schlauer?“ Das Gespräch, das tatsächlich darüber entscheidet, wer den Verbrauchermarkt gewinnt, ist: „Welcher Agent stellt eine Verbindung zu den Apps her, die ich bereits verwende?“
Die Plugin- und Connector-Bibliothek von Codex umfasst jetzt Google Workspace (Gmail, Drive, Kalender, Chat), Spotify, Instacart, Booking und eine Kreativsuite, die Blender, Adobe Photoshop, Autodesk und Ableton umfasst. Die kreativen App-Integrationen sind begrenzt – Sie können eine Photoshop-Sitzung noch nicht vollständig automatisieren und die Ableton-Hooks sind einfach – aber die Richtung ist unverkennbar. OpenAI baut eine Struktur auf, über die der Agent auf die Tools zugreifen kann, für die Sie bereits bezahlen.
Dies ist das gleiche Playbook, das Microsoft in den 1990er Jahren mit Office und Apple in den 2010er Jahren mit dem App Store durchgeführt hat. Die Plattform mit den meisten Apps gewinnt, auch wenn die zugrunde liegende Technologie nicht die beste ist. Die Anzahl der 90+ Anschlüsse aus dem Codex-Update vom April 2026 ist keine Vanity-Zahl. Es ist ein Wassergraben.
Wenn ich jetzt im Produktteam von Anthropic wäre, würde mich die Connector-Bibliothek nachts den Schlaf rauben. Die Modelle von Claude sind ausgezeichnet. Claude Code ist meiner ehrlichen Meinung nach immer noch der beste Agent für ernsthafte Codierungsarbeiten – ich habe über mein Claude Code-Workflow-Setup und [das dynamische Duo aus Codex und Für Verbraucherprofis ist jedoch die Integrationszahl wichtiger als die Modellbewertung.
Was diese Woche sonst noch geliefert wurde, das Codex-Beobachter interessieren sollte
Zwei Nicht-Codex-Geschichten in den letzten zwei Wochen, die den Kontext dieser ganzen Verschiebung verändern.
Erstens veröffentlichte DeepSeek V4 am 24. April 2026** – ein Open-Source-Modell mit einem 1-Millionen-Token-Kontextfenster, einer MIT-Lizenz und einem Preis, der GPT-5.5 und Zwei Varianten werden ausgeliefert: V4-Pro mit insgesamt 1,6T / 49B aktiven Parametern und V4-Flash mit insgesamt 284B / 13B aktiv. Der hybride Aufmerksamkeitsmechanismus – Compressed Sparse Attention plus Heavy Compressed Attention – macht den 1M-Kontext wirtschaftlich nutzbar. In der 1M-Token-Kontexteinstellung benötigt V4-Pro im Vergleich zu V3.2 Berichten zufolge nur 27 % der Einzel-Token-Inferenz-FLOPs und 10 % des KV-Cache. Offene Gewichte, auf Hugging Face, lauffähig auf Consumer-Hardware mit Einschränkungen. Das ist ein seriöses Modell.
Der Grund, warum dies für die Codex-Verbrauchergeschichte wichtig ist: Wenn Open-Source-Modelle weiterhin die Leistungslücke schließen und kostengünstig auf lokaler Hardware laufen, wird die Agentenschicht zum Unterscheidungsmerkmal, nicht das Modell. Codex hat einen Vorsprung auf der Agentenebene. Doch diesen Vorsprung muss es nun gegen Open-Source-Agentenstacks verteidigen, die auf Modellen der DeepSeek-Klasse basieren.
Zweitens hat **Google am 28. April 2026 die Betaversion „Ask YouTube“ gestartet, die bis zum 8. Juni für US-amerikanische YouTube Premium-Abonnenten läuft. Es verwandelt die Suchleiste von YouTube in einen Chatbot, der strukturierte Antworten, kuratierte Clips und zeitgestempelte Links aus der gesamten Videobibliothek abruft. Neal Mohan sagte im Januar 2026, dass bereits mehr als 20 Millionen Nutzer pro Monat das Ask-Konversationstool AI auf YouTube nutzen. Zwanzig Millionen.
So sieht die Einführung von AI bei Verbrauchern im großen Maßstab aus. Es handelt sich nicht um eine separate App. Es handelt sich um eine Chatbox, die in die Oberfläche eingebettet ist, wo sich bereits Menschen befinden. Das ist genau die Wette, die OpenAI mit Codex eingeht: Betten Sie einen Agenten in den Desktop, den Browser und die Apps ein, die Sie bereits verwenden, und machen Sie den Agenten zur neuen Schnittstelle für alle.
Das sind keine isolierten Geschichten. Es handelt sich um dieselbe Geschichte, die auf drei verschiedene Arten erzählt wird: Beim AI-Rennen im Jahr 2026 geht es nicht mehr darum, wer das intelligenteste Modell hat. Es geht darum, wem die Agentenoberfläche gehört, die die Apps berührt, die die Leute tatsächlich nutzen.
Was ich diese Woche eigentlich tun würde
Wenn Sie als Entwickler dies lesen, sind Sie wahrscheinlich bereits bei Codex oder Claude Code oder beiden. Der Rat für Sie ist kurz: Verbringen Sie diese Woche zwei Stunden damit, Codex so zu verwenden, wie es ein Nicht-Entwickler tun würde. Führen Sie die wöchentliche kurze Eingabeaufforderung aus. Probieren Sie die Workflow-Prüfungsaufforderung aus. Sie werden sehen, wonach Ihre weniger technisch versierten Freunde und Kunden fragen werden, und Sie werden dem Gespräch sechs Monate voraus sein, wenn sie es tun.
Wenn Sie ein Wissensarbeiter sind, der von AI-Agenten gehört hat, sich aber noch nie mit einem von ihnen getroffen hat, ist jetzt der richtige Zeitpunkt. Drei konkrete Schritte:
1. Holen Sie sich ein ChatGPT Plus-Abonnement, falls Sie noch keins haben. Zwanzig Dollar pro Monat. Codex ist im Paket enthalten. Überspringen Sie vorerst die Pro-Stufe, es sei denn, Sie führen mehrere parallele Agenten aus – Plus reicht für den Anfang aus.
2. Aktivieren Sie die Computernutzung im Hintergrund und den In-App-Browser in den Codex-Einstellungen. Dies ist standardmäßig deaktiviert. Wenn Sie es zum ersten Mal einschalten, führt Sie das System durch Berechtigungsaufforderungen, die beängstigend aussehen, es aber nicht sind – Sie sperren den Agenten in eine eigene Sitzung ein und geben ihm nicht den Root-Zugriff auf Ihrem Computer.
3. Führen Sie eine Woche lang die von OpenAI empfohlenen Verbraucheraufforderungen aus. Die wöchentliche Zusammenfassung von chief-of-staff. Das Workflow-Audit. Der Dia-Deck-Entwurf. Das Formular ausfüllen. Wählen Sie eine pro Tag aus. Versuchen Sie nicht, das gesamte Tool zu erlernen. Lernen Sie einen Arbeitsablauf nach dem anderen und lassen Sie das Muskelgedächtnis aufbauen.
Die Obergrenze dafür, wie viel Wert Sie derzeit von Codex erhalten können, ist nicht das Modell. Es ist Ihre Bereitschaft, tatsächlich zu delegieren. Die meisten Leute in meinem Umfeld, die agentic AI ausprobiert und abgesprungen haben, sind nicht abgesprungen, weil das Tool fehlgeschlagen ist. Sie sind abgesprungen, weil sie den Instinkt nicht überwinden konnten, die Aufgabe selbst zu erledigen, während der Agent arbeitete.
Trainiere diesen Instinkt. Lassen Sie es fünfzehn Minuten lang laufen. Komm zurück. Überprüfen Sie, was es bewirkt hat. Das ist die Schleife.
Die Vorhersage, auf die ich wetten werde
Wenn jemand in zwölf Monaten sagt: „Ich verwende Codex“, wird sich der Zuhörer als erstes nicht vorstellen, dass es sich um einen Entwickler in einem Terminal handelt. Das kann ein Projektmanager sein, der sein Montagsbriefing erhält, ein Kleinunternehmer, der ein Workflow-Audit erhält, oder ein Freiberufler, der ein Lieferantenformular ausfüllt. Der Entwickler-Anwendungsfall wird weiterhin bestehen. Es wird einfach aufhören, das mentale Standardmodell zu sein.
OpenAI wird dies nicht als Pivot vermarkten. Sie werden weiterhin Entwicklerfunktionen bereitstellen. Sie werden bei ihren Entwicklerveranstaltungen weiterhin über Agentencodierung sprechen. Aber die vorgeschlagenen Eingabeaufforderungen auf dem Codex-Startbildschirm, die Connector-Bibliothek und die neue Funktionsprioritätsreihenfolge werden weiterhin die wahre Geschichte erzählen. Der Hauptbestandteil einer Registerkarte ist das Produkt. Das IDE-Plugin ist das Erbe.
Der Codex consumer agent ist derzeit die am wenigsten diskutierte Produktänderung im AI. Nicht, weil es niemand bemerkt hätte – denn die Leute, die es bemerkt haben, sind größtenteils dieselben Leute, die Hype-Cycle-Aufnahmen schreiben, und dies ist kein Hype-Cycle-Moment. Es ist eine stille, geduldige Neupositionierung, die auf die 80 % des Marktes abzielt, die niemand abdeckt, weil sie nicht auf Tech-Twitter posten.
Diese 80 % werden im Laufe des nächsten Jahres aufwachen und feststellen, dass sie einen Stabschef für zwanzig Dollar im Monat haben. Wenn mich zum ersten Mal jemand auf einer Dinnerparty durch sein wöchentliches Codex-Briefing führt und er kein Entwickler ist, weiß ich, dass der Pivot funktioniert hat. Ich gebe ihm neun Monate.
Häufig gestellte Fragen
Was ist Codex consumer agent und wie unterscheidet es sich von ChatGPT?
Der Codex consumer agent ist die Codex-Desktop-App von OpenAI, die als autonomer Agent für nicht-technische Wissensarbeiter, nicht nur für Entwickler, neu positioniert wird. Im Gegensatz zu ChatGPT – einer Chat-Schnittstelle – kann Codex echte Aktionen auf Ihrem Computer ausführen: Ihren Browser steuern, lokale Dateien lesen, Formulare ausfüllen, Foliensätze entwerfen und Ihre Arbeitsabläufe überprüfen. Mit der Veröffentlichung „Background Computer Use“ vom 16. April 2026 war es das erste OpenAI-Produkt mit nativer macOS-Desktopsteuerung. Die vollständige Funktionstabelle finden Sie im Vergleichsabschnitt oben.
Muss ich jetzt Entwickler sein, um Codex verwenden zu können?
Nein. Ab dem Update vom April 2026 führt der Onboarding-Ablauf von Codex neue Benutzer durch die Aktivierung von browser control und die Verbindung mit Gmail, anstatt Git-Umgebungen zu konfigurieren. Die vorgeschlagenen Eingabeaufforderungen auf dem Startbildschirm führen zu Verbraucheraufgaben wie „Meine ungelesenen Nachrichten überprüfen“ und „Eine Folienpräsentation aus diesem Transkript erstellen“. Entwicklerfunktionen sind weiterhin vorhanden, sie sind jedoch nicht mehr die Standardoberfläche.
Wie viel kostet Codex im Jahr 2026?
Codex ist in den Plänen ChatGPT Plus (20 $/month), Business (30 $ /user/month), Pro (100 $ Es gibt auch eine kostenlose Stufe mit sehr eingeschränktem Codex-Zugriff. Für die meisten Verbraucherprofis reicht die 20-Dollar-Plus-Stufe für den Einstieg aus.
Kann Codex wirklich einen Stabschef oder Assistenten der Geschäftsleitung ersetzen?
Nicht vollständig, aber es kann die sich wiederholenden Teile absorbieren – wöchentliche Briefings per E-Mail und Slack, Workflow-Audits, Ausfüllen von Formularen, Entwürfe für Präsentationsfolien, Multi-App-Recherche. Bei meinen Tests ergab ein achtzehnminütiger Codex-Lauf einen wöchentlichen Briefing, für den ich manuell neunzig Minuten benötigt hätte. Es ist ein Kraftmultiplikator für Solobetreiber und kleine Teams und kein vollständiger menschlicher Ersatz.
Codex vs. Claude in Chrome – welcher Agent ist besser für Browseraufgaben?
Codex ist in seinem In-App-Sandbox-Browser schneller und präziser. Claude in Chrome ist besser, wenn Sie den Agenten benötigen, um Ihre echte, angemeldete Browsersitzung zu verwenden. Auswahl basierend auf Vertrauensmodell: Sandbox für Geschwindigkeit und Isolation, echte Chrome-Erweiterung für authentifizierte Arbeitsabläufe. Beide verbessern sich rasch. Vollständige Aufschlüsselung in der Vergleichstabelle oben.
Lasst uns zusammenarbeiten
Möchten Sie AI-Systeme aufbauen, Arbeitsabläufe automatisieren oder Ihre technische Infrastruktur skalieren? Ich würde gerne helfen.
- Fiverr (benutzerdefinierte Builds und Integrationen): fiverr.com/s/EgxYmWD
- Portfolio: mejba.me
- Ramlit Limited (Unternehmenslösungen): ramlit.com
- ColorPark (Design & Branding): colorpark.io
- xCyberSecurity (Sicherheitsdienste): [xcybersecurity.io](https://www.xcybersecurity.io