OpenAI Codex Super App: Ich habe jede Funktion getestet

Das erste, was ich von der Super-App Ich zog den Ordner in die App, tippte einen Satz darüber ein, dass ich sie in einem Excel-Dashboard haben möchte, und ging in die Küche, um Kaffee zu kochen. Als ich zurückkam, hatte Codex jede Quittung gelesen, Anbieter, Datum, Betrag, Steuer und Kategorie extrahiert, sie in ein Blatt eingefügt, eine Pivot-Tabelle nach Kategorie hinzugefügt und fragte mich, ob ich ein Diagramm wollte. Der Kaffee war noch nicht einmal fertig.

Zu diesem Zeitpunkt hörte ich auf, das Codex-Update vom April 2026 als eine weitere Pressemitteilung von OpenAI zu betrachten, und begann, es als die Agentenplattform zu betrachten, auf die ich gewartet hatte, seit GPT-4 zum ersten Mal Tools erhielt. Die Super-App OpenAI Codex – ja, sie heißt tatsächlich Codex und nicht „Codeex“, wie es in YouTube-Tutorials immer wieder ausgesprochen wird – ist nicht mehr nur ein Codierungsassistent. Es handelt sich um einen Desktop-Agenten mit vollem Dateizugriff, persistentem Speicher, über neunzig plugins, Computersteuerung, geplanten Automatisierungen, integrierter Bildgenerierung durch GPT-image-1.5 und einem Bildschirmüberwachungsspeichersystem namens Chronicle, das entweder die Zukunft des Kontexts oder eine Datenschutzkatastrophe darstellt, je nachdem, welche Rezension Sie lesen.

Ich führe es seit zwei Wochen in meinen tatsächlichen Arbeitsabläufen aus: Empfangsverarbeitung, E-Mail-Triage nach Markenangeboten, Erstellung von Canva-Präsentationen, Web-App-Tests, geplante Freitagsberichte und ein Experiment, bei dem ich mir von Chronicle beim Bearbeiten einer Folienpräsentation zusehen ließ und es darum bat, basierend auf dem, was es gesehen hat, Verbesserungen vorzuschlagen. Einiges davon war wirklich beeindruckend. Einiges davon stolperte genau an den Stellen, an denen man erwarten würde, dass eine Super-App der Version 1 stolpert. Und ein Teil davon brachte mich dazu, das Ganze achtundvierzig Stunden lang auszuschalten, während ich darüber nachdachte, ob ich so viel Überwachung auf meinem eigenen Rechner haben wollte.

Das ist das ehrliche Urteil. Bleiben Sie im Abschnitt Chronicle – hier wird der Kompromiss zwischen Privatsphäre und Autonomie real.

Was OpenAI im April 2026 wirklich veröffentlicht hat

Lassen Sie uns vor allem den Namen und den Zeitplan klarstellen, denn es gibt genug Verwirrung rund um diese Veröffentlichung, um einen separaten Beitrag zu füllen.

Das Produkt heißt Codex. Es läuft als Desktop-App auf macOS (Windows befindet sich in der Vorschau) und ist mit kostenpflichtigen ChatGPT-Plänen gebündelt – Plus für zwanzig Dollar pro Monat, Pro für einhundert oder zweihundert pro Monat sowie Business-, Edu- und Enterprise-Stufen. Es gibt kein separates Codex-Abonnement. Ihr ChatGPT-Plan definiert, wie viel Codex-Nutzung Sie erhalten, bevor Sie die Kreditlimits erreichen, und die neue Pro-Stufe im Wert von hundert Dollar vermarktet ausdrücklich „5x mehr Codex-Nutzung als Plus“ mit einem feierlichen 2x-Bonus, der bis zum 31. Mai 2026 läuft.

Das Update vom April 2026 hat Codex vom „Coding Agent“ zur „Super-App“ gemacht. OpenAI hat es in zwei Wellen verschickt. Die erste Welle landete am 16. April mit der Desktop-Überarbeitung: vollständiger Dateizugriff, In-App-Browser, Computernutzung, GPT-image-1.5-Generierung und das neue Plugin-System. Die zweite Welle landete ein paar Tage später mit Chronicle in der Opt-in-Forschungsvorschau, nur ChatGPT Pro, nur macOS, noch nicht verfügbar in der EU, Großbritannien oder der Schweiz.

Die Versand-Schlagzeilen aus der eigenen Ankündigung von OpenAI: über neunzig plugins beim Start (Slack, Gmail, Notion, Google Drive, Microsoft Suite, Atlassian Rovo, GitLab, CircleCI, Figma, Render, Neon, Remotion und viele andere), vollständiger Speicher und Personalisierung für bei ChatGPT angemeldete Desktop-Benutzer und eine Demo Codex hat aus einer einzigen Eingabeaufforderung heraus ein komplettes Rennspiel erstellt und dabei mehr als 7 Millionen Token sowie Fähigkeiten in den Bereichen Bildgenerierung und Webspielentwicklung eingesetzt.

Das ist die Oberfläche. Das Interessante daran ist, was passiert, wenn man versucht, echte Arbeit zu leisten.

Vollständiger Dateizugriff: der Belegtest

Die größte mentale Veränderung im Vergleich zu ChatGPT Agent oder Claude Code besteht darin, dass Codex jetzt tatsächlich in Ihrem Dateisystem lebt. Nicht als Sandbox-Cloud-Worker, der in einen synchronisierten Ordner greift. Nicht als CLI-Tool, das in jedem Verzeichnis ausgeführt wird, in das Sie cd sind. Als Desktop-Anwendung mit nativem Dateisystemzugriff, die lesen, schreiben und ändern kann, worauf Sie sie richten – mit der Einschränkung, dass Sie den Zugriff Ordner für Ordner und nicht pauschal gewähren.

Ich habe dies mit dem Beleg-Workflow getestet, da ich diese Art von Aufgabe aufgegeben hatte. Dreiundfünfzig Quittungen mit zerknitterten Ecken, von meinem Telefon in JPGs gescannt, liegen in einem Ordner namens 2026-q1-expenses-final-FINAL. Ich habe Codex auf den Ordner gerichtet und nach einem Excel-Dashboard mit Kategoriesummen, monatlichen Aufschlüsselungen und einer Markierung für alle Belege gefragt, bei denen die OCR-Konfidenz niedrig war.

Was dann geschah, war der Moment, der mich vom Local-Files-First-Design überzeugte. Codex öffnete jedes Bild, führte eine Visionsanalyse durch, extrahierte die strukturierten Felder, schrieb sie in eine CSV-Datei, öffnete dann die CSV-Datei mit einem Python-Fähigkeiten, generierte die Excel-Datei mit Formatierung und einer Pivot-Tabelle und speicherte sie neben den Originalen. Kein Upload. Nein „Bitte fügen Sie Ihre Quittungen in den Chat ein.“ Die Daten haben den Ordner, in dem sie begonnen haben, nie verlassen, bis ich es ihnen gesagt habe.

Der Haken: Die OCR-Konfidenzflagge von Codex funktionierte bei 47 der 53 Belege einwandfrei. Sechs Quittungen – alle von derselben Tankstelle, die auf Thermopapier druckt, das innerhalb einer Woche verblasst – kamen mit wenig vertrauenswürdigen Dollarbeträgen zurück. Codex hat sie markiert, nicht erraten, und sie in einer separaten Registerkarte „Manuelle Überprüfung“ in der Tabelle abgelegt. Das ist das Verhalten, das ich von einem Agenten erwarte. Der Fehlermodus, vor dem ich Angst hatte – selbstbewusst Dollarbeträge zu erfinden, um die Zellen zu füllen – ist nicht eingetreten.

Vergleichen Sie dies mit Claude Code, das ich ausführlich in meinem Beitrag zu Claude Code 3.2 Power-User-Hacks beschreibe. Claude Code kann den gleichen Workflow ausführen, wenn Sie es verkabeln – es handelt sich schließlich um einen CLI-Agenten mit Dateizugriff. Aber die Desktop-Benutzeroberfläche von Für die Art von Person, die mich damit beauftragt, diese Dinge zu automatisieren, ist diese niedrigere Hürde der Unterschied zwischen der Übernahme und der Nichtübernahme.

Auch der Datenschutzrahmen ist wichtig. Unter lokalen Dateien versteht man die Quittungen, die Kontoauszüge, die Verträge – nichts davon wird im großen Stil auf die Server von OpenAI hochgeladen. Das Modell kommuniziert weiterhin mit der API von OpenAI, um die eigentliche Argumentation durchzuführen, aber die Dateinutzlast bleibt lokal. Das ist ein anderes Bedrohungsmodell als der Cloud-Sandbox-Ansatz von ChatGPT Agent und für einen Großteil meiner Kundenarbeit – Agenturen, die Kundendaten verwalten, Freiberufler mit NDAs – ist es das einzig akzeptable Modell.

Dieser Datenschutzrahmen wird wiederkommen, wenn wir bei Chronicle ankommen. Halten Sie daran fest.

Persistenter Speicher: agents.md plus die automatische Ebene

Der Speicher in Codex besteht aus zwei Schichten, und die Unterscheidung ist wichtiger, als die eigenen Dokumente von OpenAI deutlich machen.

Die erste Ebene ist agents.md. Dies ist die manuelle Speicherdatei – ein Markdown-Dokument, das Sie selbst schreiben und bearbeiten und in dem Sie Codex mitteilen, wer Sie sind, was Ihre Projekte sind, welche Vorlieben Sie haben und welche Abkürzungen es verwenden soll. Es handelt sich um dieselbe agents.md-Konvention, die auch die Codex-CLI verwendet, die jetzt in der Desktop-App angezeigt wird. Ich behalte eines im Stammverzeichnis jedes Projektordners und ein globales in meinem Home-Verzeichnis.

Mein globaler agents.md sieht ungefähr so aus:

- Engr Mejba Ahmed, software engineer running multi-brand content
- Brands: mejba.me, ramlit.com, colorpark.io, xcybersecurity.io
- Default editor is VS Code, default shell is zsh

# Coding preferences
- TypeScript over JavaScript when given a choice
- Tailwind for styling, never inline styles
- Prefer functional React components, no class components

# Writing preferences
- First-person voice on mejba.me posts
- No "in conclusion", no "furthermore", no "game-changing"
- 3000+ words minimum on long-form posts

Diese Datei wird jedes Mal gelesen, wenn Codex eine Sitzung in dem Verzeichnisbaum startet, in dem sie sich befindet. Sie ist deterministisch, transparent und ich kann sie einer Versionskontrolle unterziehen.

Die zweite Ebene ist der neue automatische Speicher, der in einer separaten Datei gespeichert ist. Codex verwaltet sich selbst. Hier schreibt Codex Dinge, die es im Laufe der Zeit lernt – dass ich mich über ein bestimmtes Laravel-Paket beschwert habe, dass meine letzten drei Projekte alle Drizzle anstelle von Prisma verwendet haben, dass ich kontrovers formulierte Codeüberprüfungen bevorzuge. Es ist eine andere Datei als agents.md, gerade weil OpenAI nicht möchte, dass der automatische Speicher die von Ihnen kontrollierte Datei neu schreibt.

Das Verhalten ist mir nach einer Woche aufgefallen: Das Auto-Memory ist gut bei Präferenzen und schlecht bei Fakten. Es wurde richtig erkannt, dass ich möchte, dass PR-Beschreibungen mit der benutzerorientierten Änderung und nicht mit der Codeänderung beginnen. Es „erinnerte“ sich auch daran, dass ich pnpm gegenüber npm bevorzuge, was nicht der Fall ist – ich hatte einmal erwähnt, dass ich pnpm aufgrund eines bekannten Fehlers bei einem bestimmten Tauri-Projekt vermeiden sollte, und der Speicher hat dies auf eine globale Präferenz verallgemeinert. Das ist die Art von Übergeneralisierung, die man von einem v1-Speichersystem erwarten würde, und die Lösung war unkompliziert: Ich habe die Auto-Memory-Datei direkt bearbeitet und den falschen Anspruch gelöscht.

Die Tatsache, dass es sich beim Auto-Memory um eine einfache Markdown-Datei handelt, die Sie bearbeiten können, ist allein die Designentscheidung, die mich dieser Funktion vertrauen lässt. Vergleichen Sie das mit der Speicherfunktion von Claude in der Consumer-App, die undurchsichtig ist und nur über einen Einstellungsdialog bearbeitet werden kann. Mit Codex können Sie die Datei cat, Sie können sie durchsuchen, Sie können sie über Maschinen hinweg kopieren. So sollte Erinnerung aussehen.

Plugins: wo die Super App wirklich zur Super App wird

Die über neunzig Plugin-Nummern sind die Überschrift, aber der nützlichere Rahmen ist das, was plugins tatsächlich sind. In der neuen Codex-Architektur ist ein Plugin eine Verpackungseinheit, die drei Dinge bündelt: Fähigkeiten (wiederverwendbare Workflow-Dateien), App-Integrationen (der OAuth-Handshake zu Slack oder Gmail oder Notion) und MCP-Serverkonfiguration. Mit einer Installation erhalten Sie alle drei Funktionen für dieses Tool.

Ich habe Slack, Gmail und Notion plugins getestet, weil das die drei sind, in denen ich tatsächlich lebe.

Beim Gmail-Plugin hatte ich meinen „Das ist anders“-Moment. Ich habe Codex gebeten, die E-Mails der letzten 30 Tage nach Markensponsoring-Angeboten zu durchsuchen, den Absender, den Markennamen, den angebotenen Betrag, die Frist und alle Links zu einem Briefing zu extrahieren. Es durchsuchte stapelweise den Posteingang, ignorierte Newsletter und Benachrichtigungen, fand sechs legitime Sponsoring-Anfragen, zwei Betrugsversuche, die vorgaben, Sponsoring-Anfragen zu sein, und ein Angebot, das ich völlig vergessen hatte und das bald ablaufen würde. Die Ergebnisse wurden in einer Markdown-Tabelle abgelegt und angeboten, Antworten für die legitimen Ergebnisse zu entwerfen.

Das eigentliche Qualitätsdetail, das mich dazu gebracht hat, ihm zu vertrauen: Es hat eine E-Mail einer Marke, mit der ich zuvor eine Zusammenarbeit abgelehnt hatte, korrekt als „zuvor abgelehnt, nicht erneut engagieren“ klassifiziert – denn diese Klassifizierung war in meinem agents.md aus einer Notiz enthalten, die ich Monate zuvor geschrieben hatte. Die Speicherschicht und die Plugin-Schicht sind korrekt zusammengesetzt. Auf dem Papier ist das eine Kleinigkeit. In der Praxis ist es das, was „AI-Funktionen“ in „AI-Workflows“ verwandelt.

Mit dem Slack-Plugin kann Codex Kanäle lesen, Nachrichten posten und auf Threads antworten. Ich habe einen eingerichtet, um den #client-updates-Kanal meiner Agentur in einem täglichen Briefing zusammenzufassen. Funktioniert. Das Notion-Plugin liest Seiten, erstellt Seiten und aktualisiert Datenbanken. Ich verwende es, um meinen wöchentlichen Inhaltsplan aus einer Notion-Datenbank in umsetzbare Aufgaben umzuwandeln. Funktioniert auch.

Was nicht so sauber funktionierte: die Kombination von plugins in einer mehrstufigen Aufgabe, die Berechtigungsgrenzen überschreitet. Ich habe Codex gebeten, „bei Fragen zu Kundenrechnungen mein Gmail zu lesen, den Rechnungsstatus in Notion nachzuschlagen und eine Zusammenfassung auf Slack zu posten.“ Es kam zur Hälfte durch, stoppte dann, um den Notion-Zugriff erneut zu bestätigen, weil das Sitzungstoken abgelaufen war, fragte dann erneut nach den Slack-Berechtigungen und wurde schließlich abgeschlossen. Das Endergebnis stimmte. Der Fluss war holprig. Dem Änderungsprotokoll zufolge steht die Lösung kurz bevor, aber ab Ende April 2026 ist die Cross-Plugin-Übergabe nicht ganz so nahtlos, wie es die Demovideos vermuten lassen.

Skills: Die wiederverwendbare Workflow-Ebene

Wenn plugins die Oberflächenintegration sind, sind Fähigkeiten die Workflow-Logik. Ein Skill in Codex ist eine kleine Markdown-Datei mit einem Frontmatter-Block, der Codex mitteilt, wann er aufgerufen werden soll, welche Tools er benötigt und welche Schritte zu befolgen sind. Sie befinden sich in Ihrem Skills-Verzeichnis und werden entweder per Slash-Befehl oder automatisch aufgerufen, wenn das Modell entscheidet, dass die Aufgabe übereinstimmt.

Ich habe einen namens /brand-deal-researcher erstellt. Es handelt sich um eine Markdown-Datei mit einer Länge von vielleicht vierzig Zeilen. Der Fluss, den es kodiert:

Nehmen Sie einen Markennamen als Eingabe
Durchsuchen Sie das Internet nach aktuellen Nachrichten über die Marke
Sehen Sie sich die Marketingausgabenberichte der letzten 6 Monate an (sofern öffentlich)
Überprüfen Sie meinen Gmail-Verlauf auf frühere Kontakte
Sehen Sie sich meine Notion-Datenbank mit früheren Angeboten für ähnliche Marken an
Geben Sie ein einseitiges Briefing mit der Empfehlung go/no-go aus

Ich habe die erste Version in etwa zwanzig Minuten erstellt. Der erste Durchlauf war in Ordnung, aber der Gmail-Verlaufsschritt fehlte. Ich habe die Skill-Datei bearbeitet, eine explizite Zeile „Überprüfen Sie immer Gmail, bevor Sie es empfehlen“ hinzugefügt, habe es erneut ausgeführt und es hat perfekt funktioniert. Die Tatsache, dass es sich bei Fertigkeiten um reine Textdateien handelt, die Sie bearbeiten können, ist die gleiche Designauswahl, die dafür sorgt, dass agents.md funktioniert. Es gibt keine GUI, kein proprietäres Format, keinen Schritt „Kompilieren Sie Ihre Fähigkeiten“. Sie schreiben Markdown, Codex liest es.

Skills auch Kette. Ich habe eine weitere Fähigkeit namens /brand-deal-replier, die die Ergebnisse des Forschers aufnimmt und eine Antwort-E-Mail erstellt. Die beiden komponieren. Das ist genau die Art von Architektur aus kleinen, lose verbundenen Teilen, die ich mir von einer Agentenplattform wünsche, und sie passt direkt zu meiner Meinung über Agentenfähigkeiten in Claude Code. Die beiden Ökosysteme nähern sich der gleichen Idee an: Workflows als versionierte Markdown-Dateien, die nicht in der Datenbank eines Anbieters vergraben sind.

Eingebauter GPT-image-1.5: Bildgenerierung innerhalb von Projekten

Dieses hätte ich fast abgetan. Die Bildgenerierung fühlt sich wie eine Nebenfunktion an, wenn Sie Computernutzung und Chronicle in derselben Version ausliefern. Dann habe ich versucht, es in einem tatsächlichen Content-Projekt zu verwenden und sah, warum OpenAI es gebündelt hat.

Der Ablauf, der dafür gesorgt hat, dass es Klick gemacht hat: Ich habe ein Landingpage-Mock-up erstellt. Ich habe Codex gebeten, drei Heldenbildvarianten im Projektordner zu generieren. Es verwendete GPT-image-1.5, legte drei PNGs in assets/hero/ ab und verwendete dann – ohne dass ich darum gebeten hätte – genau diese Dateien im HTML-Code, den es als nächstes erstellte. Kein Kopieren und Einfügen. Kein „Bild speichern, hochladen, referenzieren“. Das Bild und der Code befanden sich im selben Projektkontext, sodass der Bildgenerierungsschritt und der Implementierungsschritt ein kontinuierlicher Arbeitsablauf waren.

Für Einzelunternehmer, die Marketing-Websites, Kurs-Landingpages oder andere ressourcenintensive Projekte erstellen, ist dies die Funktion, die Ihnen im Stillen die meisten Schritte Ihres Tages abnimmt. Ich behaupte nicht, dass GPT-image-1.5 ein Midjourney-Ersatz für fertige kommerzielle Kunst ist – das ist nicht der Fall, und die Stile haben bei fotorealistischen Arbeiten immer noch einen leichten „AI-Bild“-Glanz. Aber für Platzhalter-Heldenaufnahmen, Symbole, Illustrationen und die dazwischen liegenden Assets, die Projekte in den Wechselkosten ertränken, ist es die richtige Entscheidung, sie inline zu haben.

Wenn Sie möchten, dass jemand den gesamten Content-plus-Design-Workflow für Ihre Marke aufbaut, übernehme ich diese Aufträge über fiverr.com/s/EgxYmWD – und ich beschreibe die Struktur, die ich verwende, im Beitrag zur Designsystemplattform AI.

Computer Use: Der Canva-Test

Dies ist die Funktion, die die meiste Demo-Sendezeit erhält, und das zu Recht. Durch die Computernutzung von Codex können Sie Ihre Maus, Ihre Tastatur und Ihren Bildschirm steuern. Öffnen Sie Apps. Klicken Sie auf die Schaltflächen. Formulare ausfüllen. Dateien ziehen. Der gesamte Desktop wird zur Werkzeugoberfläche des Agenten.

Ich habe es an zwei Workflows getestet. Erstellen Sie zunächst eine Canva-Präsentation. Zweitens das manuelle Testen einer Web-App, die ich ausgeliefert hatte.

Der Canva-Test verlief so. Ich habe Codex gebeten, eine Präsentation mit sechs Folien zu erstellen, in der ich ein Serviceangebot unter Verwendung meiner Markenfarben vorstelle, und Canva zu verwenden, damit ich sie anschließend weiter bearbeiten kann. Codex öffnete Canva im In-App-Browser, meldete mich über die gespeicherte Sitzung an, wählte eine Vorlage aus, die meinem Markenstil ähnelte, und ging dann Folie für Folie weiter. Abdeckung. Problem. Lösung. Verfahren. Fallstudie. Aufruf zum Handeln. Es hat die Kopie getippt. Es hat auf den Farbwähler geklickt. Es hat die Hexcodes der Markenfarbe aus einer Notiz gezogen, die ich in einem anderen Fenster geöffnet hatte. Die Präsentation wurde gespeichert. Das Ganze dauerte etwa zwölf Minuten.

Der Haken: Die Typografie auf Folie drei war falsch. Codex hat eine Schriftart aus der empfohlenen Liste von Canva ausgewählt und nicht die Schriftart, die ich als Markenstandard festgelegt habe. Ich sagte ihm, er solle die Typografie von Folie drei so anpassen, dass sie mit den anderen übereinstimmt. Es nahm die Korrektur vor, wendete sie an und machte es beim zweiten Durchgang richtig. Insgesamt verstrichene Zeit einschließlich der Korrektur: vielleicht fünfzehn Minuten für eine Präsentation, für die ich fünfundvierzig Minuten gebraucht hätte, wenn ich sie kalt aufgebaut hätte.

Der Web-App-Test verlief anders. Ich ließ Codex meine Staging-URL öffnen, mich als Testbenutzer anmelden, den neuen Onboarding-Ablauf durchgehen, den ich gerade versendet hatte, und mir sagen, wo er kaputt gegangen ist. Es wurden zwei echte Fehler gefunden – eine Schaltfläche, die auf Mobilgeräten sichtbar, aber nicht anklickbar war, und eine Formularvalidierungsmeldung, die zu schnell verschwand, um sie lesen zu können. Beides gehörte zu der Art von Fehlern, die man in der Qualitätssicherung erkennen würde, in Unit-Tests jedoch nicht. Codex hat sie im selben Lauf erwischt und die Reproduktionsschritte im Markdown aufgeschrieben.

Die ehrliche Kritik: Die Computernutzung ist langsamer als direkte API-Aufrufe. Wenn Codex über die API (Slack, Gmail, Notion über plugins) mit einem Dienst kommunizieren kann, geht das schnell. Wenn es darum geht, einen Browser oder eine Desktop-App Pixel für Pixel zu steuern, geschieht dies in menschlicher Tippgeschwindigkeit. Für Tools ohne APIs ist dies eine transformative Fähigkeit. Bei Tools mit APIs ist dies der langsamere Fallback. Zu wissen, wann welcher Modus zu verwenden ist, ist eine echte Fähigkeit, und das automatische Routing von Codex ist nicht perfekt – manchmal wählt es den Computer für etwas aus, das das Plugin in einem Viertel der Zeit erledigt hätte.

Hier ergibt sich auch der direkteste Vergleich mit Claude Code. Claude Code kann mit dem richtigen Kabelbaum auch die Computernutzung vorantreiben, aber Codex packt es nativ in die Desktop-App. Claude Code ist ein CLI-Tool, mit dem Sie die Computernutzung nutzen können. Codex ist eine Desktop-App mit integrierter Computernutzung. Verschiedene mentale Modelle. Verschiedene ergonomische Decken. Ich verwende Claude Code immer noch für Deep-Coding-Sitzungen, weil die Terminal-First-UX bei echter Entwicklungsarbeit gewinnt – mehr dazu in meinem Beitrag zum Zwei-Agenten-Workflow zu Claude Code und Codex. Aber für nicht-technische Computeranwendungen – den Canva, die Qualitätssicherung, das Ausfüllen von Formularen – ist die Benutzeroberfläche von Codex das bessere Werkzeug.

Automations: Berichte am Freitag um 9 Uhr

Automations sind geplante, wiederkehrende Codex-Läufe. Sie definieren die Eingabeaufforderung, Sie definieren den Zeitplan, Sie definieren, welche plugins und Fähigkeiten es verwenden kann, und dann wird es ohne Sie ausgeführt. In den Dokumenten von OpenAI geht es um „Statusberichte, Triage, Überwachung, Wartungsworkflows“. Das entspricht ungefähr der Form, die ich gebaut habe.

Meine erste Automatisierung: Führen Sie jeden Freitag um 9 Uhr den Marken-Deal-Recherche-Skill gegen alle neuen Sponsoring-Anfragen der letzten Woche durch, überprüfen Sie den Kalender auf den Inhaltsplan der nächsten Woche, fassen Sie aktive Kundenprojekte von Notion zusammen und senden Sie mir das Ergebnis per E-Mail. Es läuft, egal ob ich den Laptop öffne oder nicht. Wenn ich Codex am Freitagnachmittag öffne, ist der Bericht bereits in meinem Posteingang.

Die zweite Möglichkeit: Scannen Sie jeden Wochentag um 17:00 Uhr meine geöffneten Editor-Registerkarten (über den Chronicle-Kontext), überprüfen Sie die letzten Commits und fragen Sie, ob etwas unvollendet aussieht. Diese habe ich eher als erzwingende Funktion denn als echten Workflow erstellt – das Ziel war ein abschließendes „Haben Sie sich an die Sache erinnert?“ Schubs.

Bei der dritten bin ich am vorsichtigsten und sie führt natürlich zu Chronicle.

Chronicle: Der Datenschutz-Kompromiss, der mich innehalten ließ

Chronicle ist die Funktion, die mich dazu gebracht hat, Codex achtundvierzig Stunden lang auszuschalten und nachzudenken.

Was es tut: Mit Ihrer Einwilligung macht Chronicle im Hintergrund regelmäßig kurzlebige Screenshots Ihres Mac, sendet sie zur Verarbeitung an eine kurzlebige Codex-Sitzung auf den Servern von OpenAI und speichert die resultierenden strukturierten Erinnerungen als lokale Markdown-Dateien. Screenshots werden nach sechs Stunden gelöscht. Die strukturierten Erinnerungen – welche Apps Sie verwendet haben, welche Inhalte auf dem Bildschirm angezeigt wurden, welche Titel Sie eingegeben haben – bleiben lokal, unverschlüsselt und auf unbestimmte Zeit, bis Sie sie löschen.

Der Pitch ist echt. Chronicle gibt Codex Live-Kontext. Wenn ich ein Foliendeck bearbeite und Codex frage: „Folie drei besser machen“, weiß es, was Folie drei ist, weil es mir beim Erstellen zugesehen hat. Wenn ich mich mitten in einer Debug-Sitzung befinde und frage: „Was war das für ein Fehler von vorhin?“, kann es die Fehlermeldung von vor zwanzig Minuten abrufen, da ein Screenshot des Terminals erstellt wurde, als der Fehler ausgelöst wurde. Die Reibungsreduzierung ist echt. Der Anwendungsfall zur Präsentationsverbesserung aus der Demo ist keine Fälschung – ich habe ihn auf meinen eigenen Decks getestet und die Vorschläge waren in Ordnung.

Der Kompromiss ist auch real und die Presse war nicht freundlich. Das Register veröffentlichte einen Artikel, in dem Chronicle mit dem Datenschutz-Fußabdruck von Microsoft Recall verglichen wurde. SC Media hat darauf hingewiesen, dass der unverschlüsselte Markdown-Speicher ein weicheres Ziel ist als die verschlüsselte lokale Datenbank von Recall. Die EU, das Vereinigte Königreich und die Schweiz sind ausdrücklich von der Einführung ausgeschlossen – das ist keine sanfte Warnung, das ist OpenAI, weil er weiß, dass die regulatorischen Grundlagen noch nicht bereit sind.

Hier ist meine ehrliche Meinung, nachdem ich Chronicle vier Tage lang ausgeführt habe. Die Screenshot-Aufnahme ist wirklich kurzlebig – ich habe es überprüft, die sechsstündige Löschung erfolgt. Die Screenshots verlassen Ihren Computer und wandern zur Verarbeitung zu den Servern von OpenAI, auch wenn die resultierenden Erinnerungen lokal zurückkommen. Der Hin- und Rückweg ist der entscheidende Teil. Jeder, der Ihnen sagt, dass Chronicle „vollständig lokal wie Recall“ ist, hat die Dokumente nicht gelesen. Das ist es nicht.

Die strukturierte Speicherdatei kann im einfachen Markdown auf der Festplatte von jedem Prozess durchsucht werden, der Zugriff auf Ihr Home-Verzeichnis hat. Wenn Ihr Laptop kompromittiert ist, stellen diese Markdown-Dateien eine Bestandsaufnahme Ihrer letzten Lebenswochen dar – jede App, die Sie geöffnet haben, jedes Dokument, das Sie bearbeitet haben, jeden Fehler, den Sie gesehen haben. Es gibt keine biometrische Sperre. Es gibt keine Verschlüsselungsschicht. Es gibt nur eine Markdown-Datei, genau die Art, die automatisch sauber mit Dropbox- oder iCloud-Dokumenten synchronisiert wird, wenn Sie diese Funktionen aktiviert gelassen haben.

Ich lasse Chronicle auf meinem Hauptarbeitscomputer ausgeschaltet. Ich verwende es nur auf einem separaten Mac mini, den ich für Inhaltsworkflows verwende, bei denen das Datenschutzbedrohungsmodell anders ist und sich der Produktivitätsgewinn bei der Präsentationsbearbeitung lohnt. Das ist eine Entscheidung. Bei Ihnen könnte es anders sein. Was ich nicht tun werde, ist das, was einige der Early Adopters tun – es standardmäßig aktiviert zu lassen, auf einem einzigen primären Computer, in einem Workflow, der Kundendaten und persönliche Bankgeschäfte berührt. Die Risiko-Ertrags-Rechnung funktioniert dort nicht.

Wenn Sie im Sicherheitsbereich tätig sind, gehe ich in meinen xCyberSecurity-Komplettlösungen tiefer in die Bedrohungsmodelle für Clientdaten ein. Die Kurzfassung: Opt-in-Überwachungstools sind in Ordnung, wenn das Bedrohungsmodell und die Datensensibilität übereinstimmen. Die Standardeinstellung von Chronicle für alles ist eine Diskrepanz.

Ehrliches Urteil: Was lohnt sich, was wird überbewertet

Zwei Wochen später würde ich die acht Funktionen wie folgt nach ihrer tatsächlichen Auswirkung auf meinen Arbeitsablauf einordnen:

Echt transformativ:

Voller Dateizugriff – allein der Quittungstest macht dies zu einem festen Bestandteil meines Stapels
Plugins (speziell Gmail und Notion) – Den E-Mail-Triage-Workflow werde ich nicht aufgeben
Skills – sobald Sie drei davon erstellt haben, befinden Sie sich in einer anderen Produktivitätsstufe
Computernutzung für Nicht-API-Tools – die Canva- und QA-Flows sind echte Gewinne

Nützlich, aber situativ:

Persistenter Speicher – funktioniert, wenn Sie agents.md als Quelle der Wahrheit und den automatischen Speicher als Empfehlung behandeln
Integrierte Bildgenerierung – beseitigt reibungslos Reibungsverluste bei ressourcenintensiven Projekten
Automations – die Einrichtungszeit lohnt sich nur, wenn Sie mehr als zwei wiederkehrende Aufgaben haben, die es wert sind, geplant zu werden

Abwarten und sehen:

Chronicle – die Funktion ist real, der Datenschutzstatus ist standardmäßig falsch, führen Sie es, wenn überhaupt, auf einem separaten Computer aus

Die größere Vergleichsfrage – Codex vs. Claude Code – wird mir immer wieder gestellt. Die ehrliche Antwort: Es handelt sich um verschiedene Formen desselben Problems. Claude Code überzeugt durch tiefgreifende technische Arbeit, Terminal-native Ergonomie und Koordinationsmuster zwischen Agenten und Teams. Codex überzeugt in puncto Desktop-Ergonomie, Computernutzung für nicht programmierende Aufgaben und dem Komplettpaket aus plugins, Fähigkeiten, Speicher und Automatisierungen. Ich betreibe beides. Das sollten Sie auch tun, wenn Ihre Arbeit Technik und Betrieb umfasst.

Die Sache, die sich mit dieser Version vom April 2026 tatsächlich geändert hat, ist, dass die Formulierung „Super-App“ nicht mehr Marketing ist. Ein Agent, der auf Ihrem Computer läuft, optional Ihren Bildschirm sieht, geplante Jobs ausführt, Ihre Apps steuert und sich Ihre Präferenzen merkt, war das, was sich die Leute bei der ersten Auslieferung von AI-Assistenten von AI-Assistenten vorgestellt haben. Wir sind dieser Realität näher als je zuvor. Ob Sie in dieser Realität mit laufendem Chronicle oder mit ausgeschaltetem Chronicle und intaktem Datenschutzbedrohungsmodell leben möchten, ist die eigentliche Entscheidung, die vor Ihnen liegt.

Für mich lautet die Antwort „Ja zu fast allem, Nein zum Standard-Chronicle und eine separate Maschine für die experimentellen Dinge.“ Für Sie hängt die Antwort davon ab, was gerade auf Ihrem Bildschirm angezeigt wird und wie sehr Sie darauf vertrauen, dass eine unverschlüsselte Markdown-Datei in Ihrem Home-Verzeichnis dort bleibt.

Die Belege liegen übrigens immer noch in meinem Excel-Dashboard. Kategorisiert. Summiert. Gegengeprüft. Ich habe seit dem Tag, an dem ich diesen Ordner auf Codex gezogen habe, nicht mehr darüber nachgedacht. Das ist die Bar.

Häufig gestellte Fragen

Ist OpenAI Codex kostenlos oder benötige ich einen kostenpflichtigen Plan?

Codex ist in den Plänen ChatGPT Plus (20 $/mo), Pro (100 $ oder 200 $ Kostenloser ChatGPT-Benutzer erhalten keinen Desktop-Codex-Zugriff. Pro-Stufen erhalten das Fünffache der Codex-Nutzung von Plus, mit einem zweifachen Bonus bis zum 31. Mai 2026.

Was ist der Unterschied zwischen Codex und ChatGPT Agent?

Codex ist eine vollständige Desktop-Anwendung mit lokalem Dateizugriff, plugins, Computernutzung und geplanten Automatisierungen. ChatGPT Agent läuft in einer Cloud-Sandbox ohne dauerhaften lokalen Dateizugriff. Codex ist die Plattform; Der Agent ist eine reine Cloud-Teilmenge ähnlicher Funktionen.

Ist die Aktivierung von Chronicle sicher?

Chronicle erstellt Screenshots, die zur Verarbeitung an die Server von OpenAI übertragen werden, und speichert die resultierenden Erinnerungen als unverschlüsselte lokale Markdown-Dateien. Es ist sicherer, als einen geöffneten Browser über Ihren Bildschirm streifen zu lassen, und weniger sicher als verschlüsselte, nur lokale Lösungen wie Microsoft Recall. Ich würde es auf einem sekundären Computer ausführen, nicht auf einem primären Arbeitscomputer, der Kundendaten berührt.

Kann Codex Claude Code für Codierungsarbeiten ersetzen?

Meiner Erfahrung nach noch nicht. Codex eignet sich hervorragend für Arbeitsabläufe auf Desktop-Computern, Plugin-gesteuerte Aufgaben und die Bildgenerierung in Projekten. AI Ich betreibe beides.

Wo werden agents.md und die Auto-Memory-Dateien gespeichert?

Das Handbuch agents.md befindet sich dort, wo Sie es abgelegt haben – normalerweise im Projektstammverzeichnis oder Ihrem Home-Verzeichnis. Die Auto-Memory-Datei befindet sich im App-Datenverzeichnis von Codex und kann als einfaches Markdown bearbeitet werden, wenn Sie Übergeneralisierungen korrigieren möchten. Beide sind versionierbar und für Menschen lesbar.

Lassen Sie uns zusammenarbeiten

Möchten Sie AI-Systeme aufbauen, Arbeitsabläufe automatisieren oder Ihre technische Infrastruktur skalieren? Ich würde gerne helfen.

Fiverr (benutzerdefinierte Builds und Integrationen): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (Unternehmenslösungen): ramlit.com
ColorPark (Design & Branding): colorpark.io
xCyberSecurity (Sicherheitsdienste): xcybersecurity.io

OpenAI Codex Super App: Ich habe jede Funktion getestet