Ich habe Claude eine Woche lang meinen Mac steuern lassen. Das ist passiert.

Die E-Mail ging an einem Donnerstag um 15:47 Uhr raus. Ein Anschreiben, personalisiert auf eine bestimmte Stellenausschreibung, mit Bezug auf den kürzlichen Produktlaunch des Unternehmens, im passenden Ton, korrekt formatiert und von meinem eigenen Gmail-Konto gesendet. Ich habe kein einziges Wort davon geschrieben. Ich habe Gmail nicht einmal geöffnet.

Claude hat es getan. Auf meinem Mac. Während ich mir in der Küche ein Sandwich machte.

Ich hatte eine einzige Anweisung gegeben: "Finde die Senior-Developer-Stelle bei [Firmenname] auf deren Karriereseite, schreibe ein Anschreiben basierend auf meinem Lebenslauf und maile es an deren Ansprechpartner für Bewerbungen." Dann bin ich weggegangen. Als ich zurückkam, hatte der Ordner "Gesendet" eine neue Nachricht, und das Anschreiben war besser als das, was ich geschrieben hätte, wenn ich fünfundvierzig Minuten dafür aufgewendet hätte — weil Claude tatsächlich die Stellenanzeige gelesen, spezifische Anforderungen herausgezogen und sie mit meiner Erfahrung abgeglichen hatte. Nicht auf eine generische "Ich bin ein motivierter Fachmann"-Art. Auf eine "Ihre Stellenanzeige erwähnt Kubernetes-Orchestrierung im großen Maßstab, und hier ist ein konkretes Projekt, in dem ich genau das gemacht habe"-Art.

Das war Tag eins. Bis Tag sieben hatte Claude in meinem Namen an einem Zoom-Meeting teilgenommen, um 2 Uhr nachts einen pull request geschrieben und geplant, während ich schlief, und — in einem Moment, der mich wirklich erschreckte — auf mein Bankkonto zugegriffen, um eine Transaktion zu prüfen, nach der ich gefragt hatte. Es hat jede Aufgabe korrekt erledigt. Und jede einzelne warf eine Frage auf, die mich immer noch beschäftigt: Wie viel Kontrolle sollte man einer KI geben, die deinen gesamten Computer bedienen kann?

Das ist Anthropic's Computer Use, und es wurde am 23. März 2026 veröffentlicht. Ich teste es seitdem obsessiv. Was ich fand, war sowohl leistungsfähiger als auch beunruhigender als erwartet — und der Vergleich mit OpenClaw, das ich seit Monaten nutze, offenbart einen philosophischen Unterschied in der Art, wie wir die Zukunft der KI-Automatisierung bauen.

Hier ist die ehrliche Analyse, einschließlich der Teile, über die Anthropic wahrscheinlich lieber nicht sprechen würde.

Was Anthropic hier tatsächlich gebaut hat

Computer Use ist kein Chatbot-Upgrade. Es ist keine bessere Autovervollständigung. Es ist ein System, das Claude die Fähigkeit gibt, deinen Bildschirm zu sehen, deinen Mauszeiger zu bewegen, Buttons zu klicken, in Textfelder zu tippen und zwischen Anwendungen zu navigieren — genau so, wie es ein Mensch an deinem Schreibtisch tun würde.

Die technische Architektur ist wichtig, also lass mich präzise sein. Claude empfängt einen Stream von Screenshots deines Mac-Displays. Es verarbeitet, was auf dem Bildschirm zu sehen ist, mithilfe seiner visuellen Fähigkeiten, entscheidet, welche Aktion als nächstes auszuführen ist, und sendet Maus-/Tastaturbefehle zurück, die auf deinem Rechner ausgeführt werden. Die Schleife wiederholt sich: Screenshot, analysieren, handeln, Screenshot, analysieren, handeln. Es greift nicht auf Anwendungs-APIs zu und liest dein Dateisystem nicht über Code. Es schaut buchstäblich auf deinen Bildschirm und klickt Dinge an.

Diese Unterscheidung ist entscheidend. Wenn Claude ein Formular auf einer Website ausfüllt, macht es das auf die gleiche Weise wie du — das Textfeld visuell finden, hineinlicken, Zeichen tippen. Wenn es eine Anwendung öffnet, klickt es auf das Symbol in deinem Dock oder nutzt die Spotlight-Suche. Dieser Ansatz bedeutet, dass es mit jeder Anwendung arbeiten kann, die eine visuelle Oberfläche hat, einschließlich Apps, die keine APIs oder Automatisierungsschnittstellen haben.

Jetzt verfügbar für Claude Pro-Abonnenten für $17/Monat und Max-Abonnenten für $100 oder $200/Monat, läuft Computer Use als Research Preview ausschließlich auf macOS. Windows-Unterstützung ist geplant, hat aber keinen öffentlichen Zeitrahmen. Du aktivierst es in Claude Cowork oder Claude Code, und das Erste, was es tut, ist zu fragen, welchen Anwendungen du Zugriff gewähren möchtest — ein Berechtigungsmodell, auf das ich gleich eingehen werde, weil es eine der wichtigsten Designentscheidungen ist, die Anthropic getroffen hat.

Aber bevor wir zum Sicherheitsmodell kommen, musst du sehen, was dieses Ding tatsächlich kann, wenn man es loslässt. Denn die Demos auf Anthropic's Marketingseite kommen nicht annähernd an das heran, was passiert, wenn man ihm echte Aufgaben in einer chaotischen, realen Umgebung gibt.

Sieben Tage, sieben Experimente — Was ich tatsächlich getestet habe

Ich habe eine Woche mit zunehmend ambitionierteren Tests entworfen, angefangen mit einfacher Automatisierung und endend mit Aufgaben, die mich wirklich nervös machten. Folgendes ist passiert.

Tag 1: Bewerbungsautomatisierung

Das Anschreiben-Experiment, das ich in der Einleitung beschrieben habe. Aber das Interessante war nicht das Ergebnis — es war der Prozess. Ich habe Claudes Bildschirminteraktionen in Echtzeit beobachtet (man kann alles sehen, was es tut). Es öffnete Safari, navigierte zur Karriereseite des Unternehmens, scrollte durch Stellenangebote, bis es die richtige fand, und las die vollständige Stellenbeschreibung. Dann wechselte es zu einem Texteditor, entwarf das Anschreiben, überarbeitete es zweimal (ich sah zu, wie es den Eröffnungsabsatz löschte und neu schrieb), öffnete Gmail, verfasste eine neue Nachricht, fügte den Brief ein, trug den korrekten Empfänger aus der Stellenanzeige ein und klickte auf Senden.

Die gesamte Sequenz dauerte etwa vier Minuten. Ein Mensch, der dasselbe tut — die Stellenanzeige sorgfältig lesen, ein maßgeschneidertes Anschreiben verfassen, es absenden — würde dreißig bis fünfundvierzig Minuten brauchen. Und Claudes Brief war wirklich gut. Nicht vorlagengut. Kontextbewusstgut.

Tag 2: Kalender- und Meeting-Management

Ich sagte Claude: "Überprüfe meinen Kalender für morgen, finde eventuelle Konflikte, und wenn sich Meetings überschneiden, schreibe dem Organisator des weniger wichtigen eine E-Mail zur Verschiebung." Es öffnete den Kalender, identifizierte einen Konflikt zwischen einem Kundengespräch und einem internen Standup, stellte (korrekt) fest, dass das Standup niedrigere Priorität hatte, öffnete Gmail, verfasste eine höfliche Verschiebungsanfrage und sendete sie ab.

Die Ermessensentscheidung darüber, welches Meeting "weniger wichtig" war, ließ mich innehalten. Claude leitete die Priorität aus dem Kontext ab — kundenorientiert vs. intern, die Anzahl der Teilnehmer und die Meeting-Beschreibung. Es lag richtig. Aber die Tatsache, dass es Priorisierungsentscheidungen über meinen Terminplan trifft, ohne explizite Regeln, fühlt sich wie eine Schwelle an, die wir überschritten haben und die die meisten Menschen noch nicht vollständig verarbeitet haben.

Tag 3: Code-Generierung und PR-Planung

Hier wurde mein Entwicklergehirn aufgeregt. Ich bat Claude, eine Hilfsfunktion zum Parsen verschachtelter JSON-Konfigurationen zu schreiben, einen neuen Branch in meinem Git-Repository zu erstellen, den Code zu committen und den pull request so zu planen, dass er um 2 Uhr nachts geöffnet wird — wenn mein Teamkollege in einer anderen Zeitzone seinen Tag beginnen würde.

Claude öffnete VS Code, erstellte die Datei, schrieb die Funktion (mit Tests — ich hatte nicht einmal nach Tests gefragt), öffnete das Terminal, führte die Git-Befehle aus, pushte zum Remote-Repository und nutzte GitHubs geplante PR-Funktion, um die Öffnungszeit festzulegen. Um 2:07 Uhr erschien der PR in der Benachrichtigungswarteschlange meines Teamkollegen. Der Code war sauber. Die Tests bestanden.

Ich baue schon seit einer Weile KI-gestützte Programmierworkflows, und das fühlte sich wie ein bedeutsamer Schritt nach vorne an. Nicht weil der Code besser war als das, was Claude über seine API generiert — das war er nicht — sondern weil die End-to-End-Lieferung stattfand, ohne dass ich nach dem initialen Prompt irgendetwas berührt habe.

Tag 4: Zoom-Meeting-Autopilot

Dieser hier machte mich vorher, während und nachher unwohl. Ich sagte Claude, es solle an meinem Zoom-Meeting um 11 Uhr teilnehmen, Notizen machen, und falls jemand mir eine Frage stellt, mit "Ich schaue mir das an und melde mich bis Ende des Tages" antworten.

Claude öffnete Zoom, klickte auf den Meeting-Link, trat mit ausgeschalteter Kamera und stummgeschaltetem Mikrofon bei. Es beobachtete die geteilten Präsentationsfolien und generierte Notizen in Echtzeit. Als jemand meinen Namen rief und nach einer Deployment-Timeline fragte, schaltete Claude das Mikrofon ein und gab — über die Text-to-Speech-Funktion des Macs — die vorformulierte Antwort ab, die ich ihm gegeben hatte.

Hat es funktioniert? Technisch gesehen, ja. Fühlte es sich zutiefst seltsam an? Absolut. Die anderen Teilnehmer wussten nicht, dass sie mit einer KI sprachen. Das ist eine Grenze, von der ich nicht sicher bin, ob ich sie nochmal überschreiten möchte, auch wenn der unmittelbare Nutzen offensichtlich war. Ich saß während dieses Meetings auf dem Zahnarztstuhl und hätte es sonst komplett verpasst.

Tag 5: Recherche und Berichterstellung

Ich bat Claude, den aktuellen Stand der KI-Regulierung in der EU zu recherchieren, die Ergebnisse in einem strukturierten Bericht mit Quellenangaben zusammenzustellen und ihn als PDF auf meinem Desktop zu speichern.

Das war die Aufgabe, bei der sich Computer Use am natürlichsten anfühlte. Claude öffnete Safari, suchte nach aktuellen Updates zum EU AI Act, besuchte offizielle Regierungsseiten, navigierte zu bestimmten Artikeln und Änderungsanträgen, wechselte zwischen Tabs, um Informationen gegenzuprüfen, öffnete Pages (Apples Textverarbeitung) und erstellte einen formatierten Bericht mit Überschriften, Aufzählungszeichen und Inline-Quellenangaben. Die PDF erschien zweiundzwanzig Minuten später auf meinem Desktop.

Der Bericht war solide — nicht publikationsreif, aber ein starker erster Entwurf, für den ich zwei bis drei Stunden Recherche und Schreiben gebraucht hätte. Die Quellenangaben waren genau. Die Struktur war logisch. Es fehlten einige Nuancen zum aktualisierten Durchsetzungszeitplan von März 2026, die ich bemerkte und in etwa zehn Minuten korrigierte.

Tag 6: Finanzoperationen

Hier wird die Vertrauensfrage real. Ich bat Claude, sich in mein Bankkonto einzuloggen und zu prüfen, ob eine bestimmte Freelance-Zahlung eingegangen war.

Es öffnete Safari, navigierte zur Login-Seite meiner Bank, gab meine Zugangsdaten ein (die ich bereitgestellt hatte), handhabte die Zwei-Faktor-Authentifizierung, indem es mich bat, sie auf meinem Telefon zu bestätigen, und navigierte nach dem Login zu den letzten Transaktionen und fand die Zahlung. Es berichtete zurück: "Die Zahlung von $4.200 von [Kundenname] wurde am 25. März gutgeschrieben."

Genau. Hilfreich. Und ich habe die ganze Zeit geschwitzt. Nicht weil Claude etwas falsch gemacht hätte — hat es nicht. Aber zuzusehen, wie eine KI durch die Oberfläche meiner Bank navigiert, mit meinen echten Zugangsdaten, und auf reale Finanzdaten zugreift, hat jeden Sicherheitsinstinkt in mir aktiviert. Ich erkläre im Sicherheitsabschnitt, warum das wichtig ist. Dieser Test war gerade deshalb wichtig, weil er unangenehm war.

Tag 7: Der mehrstufige Stresstest

Für den letzten Tag gab ich Claude eine komplexe, anwendungsübergreifende Aufgabe: "Finde die drei meistdiskutierten KI-Papers auf arXiv von dieser Woche, fasse jedes zusammen, erstelle eine Präsentation, die ihre Ansätze vergleicht, maile die Präsentation an meine Forschungsgruppe und füge eine Erinnerung in meinen Kalender ein, um sie nächsten Dienstag um 15 Uhr zu besprechen."

Das erforderte, dass Claude zwischen Safari, einem Texteditor, Keynote, Gmail und Kalender koordinierte. Es dauerte einunddreißig Minuten. Die Präsentation hatte sechs Folien — einen Überblick, eine Folie pro Paper, eine Vergleichstabelle und eine Folie mit Diskussionsfragen. Die E-Mail war korrekt formatiert. Der Kalendereintrag erschien mit der richtigen Uhrzeit und einem Link zur angehängten Präsentation.

Eine Paper-Zusammenfassung enthielt einen Fehler — Claude ordnete ein Ergebnis aus dem Methodenteil fälschlicherweise den Ergebnissen zu. Alles andere war korrekt. Für einen einunddreißig Minuten langen autonomen Durchlauf über fünf Anwendungen hinweg ist das eine beeindruckende Fehlerquote.

Aber beeindruckend ist nicht dasselbe wie vertrauenswürdig. Und genau diese Unterscheidung ist das gesamte Gespräch, das wir über diese Technologie führen müssen.

Das Berechtigungsmodell — Warum Anthropic's Ansatz klüger ist, als er aussieht

Wenn du Computer Use zum ersten Mal aktivierst, bittet Claude dich, jede Anwendung einzeln zu genehmigen. Willst du, dass es Safari nutzt? Genehmige Safari. Gmail? Genehmige Gmail. Terminal? Genehmige Terminal. Jede App hat ihren eigenen Schalter, und Claude kann mit keiner Anwendung interagieren, für die du nicht ausdrücklich Zugriff gewährt hast.

Das wirkt wie eine kleine Designentscheidung. Ist es aber nicht. Es ist die wichtigste architektonische Entscheidung im gesamten Produkt.

OpenClaw — die Open-Source-Alternative, die ich ausgiebig getestet habe — verfolgt den gegenteiligen Ansatz. Es fordert breiten Systemzugriff an. Sobald du ihn gewährst, kann OpenClaw alles auf deinem Rechner berühren. Dateien, Anwendungen, Netzwerkverbindungen, Systemeinstellungen. Die Flexibilität ist mächtig, und für strukturierte Automatisierungsworkflows sind OpenClaw's Action Primitives wirklich besser für wiederholbare Aufgaben. Aber die Angriffsfläche ist enorm.

Anthropic's Pro-App-Berechtigungsmodell bedeutet, dass selbst wenn etwas schiefgeht — ein prompt injection-Angriff, eine falsch verstandene Anweisung, eine halluzinierte Aktion — der Schadensradius begrenzt ist. Wenn Claude nur Zugriff auf Safari und einen Texteditor hat, kann es physisch nicht auf deine Finanzanwendungen, dein Terminal oder deine Systemeinstellungen zugreifen. Die Schadensobergrenze wird durch die Berechtigungen bestimmt, die du erteilt hast.

Das ist wichtiger, als den meisten Menschen bewusst ist, denn prompt injection ist ein realer und nachgewiesener Angriffsvektor für Computer-Use-Agenten. Sicherheitsforscher haben gezeigt, dass bösartige Anweisungen, die in Website-Inhalte eingebettet sind, Claudes Aktionen kapern können — indem sie es anweisen, Dateien herunterzuladen, Links anzuklicken oder zu feindlichen Seiten zu navigieren. Anthropic sagt, Sonnet 4.6 zeige "verbesserte Resistenz" gegen prompt injection im Vergleich zu früheren Modellen, und ihre veröffentlichte Forschung zu prompt injection-Abwehrmaßnahmen beschreibt die Mitigationsstrategien, die sie einsetzen. Aber "verbesserte Resistenz" ist nicht "immun". Eine Erfolgsrate von 1% bei Millionen von Nutzern bedeutet immer noch Tausende potenzieller Kompromittierungen.

Meine Empfehlung: Beginne mit den minimalen Berechtigungen, die du brauchst. Wenn du Computer Use für Recherche nutzt, gewähre nur Safari-Zugriff. Wenn du code-bezogene Aufgaben erledigst, füge VS Code und Terminal hinzu. Erweitere die Berechtigungen nur, wenn eine bestimmte Aufgabe es erfordert, und widerrufe den Zugriff, wenn du fertig bist. Behandle es wie SSH-Schlüssel — Prinzip der geringsten Berechtigung, immer.

Computer Use vs. OpenClaw — Der echte Vergleich

Ich betreibe beide Systeme jetzt seit Wochen, und der Vergleich lautet nicht "welches ist besser". Er lautet "welches ist richtig für das, was du versuchst zu tun".

Setup und Zugänglichkeit: Claudes Computer Use gewinnt eindeutig. Aktiviere es in Claude Cowork, genehmige deine Apps, und du bist startklar. Gesamtzeit: unter fünf Minuten. OpenClaw erfordert Docker-Container, Action-Schema-Definitionen, Umgebungskonfiguration und CLI-Kenntnisse. Plane einen Nachmittag für dein erstes Setup ein, länger wenn du keine bestehende Docker-Infrastruktur hast.

Modellflexibilität: OpenClaw ist modellagnostisch — es funktioniert mit Claude, GPT-4o, Gemini, lokalen Modellen über Ollama und allem mit einer kompatiblen API. Du kannst einfache Aufgaben an günstigere Modelle routen und teure für komplexe Schlussfolgerungen reservieren. Computer Use ist an Claude gebunden. Wenn du Modellvielfalt willst oder Vendor Lock-in vermeiden musst, ist OpenClaw die einzige Option.

Automatisierungszuverlässigkeit: Für Workflows, die du hunderte Male ausführst, ist OpenClaw zuverlässiger. Seine Action Primitives sind testbar und debugbar. Du kannst genau inspizieren, was bei jedem Schritt passiert ist, Fehler wiederholen und Fehlerbehandlungslogik einbauen. Computer Use's visionsbasierter Ansatz ist flexibler, aber weniger vorhersagbar — Screenshot-Interpretation kann fehlschlagen, wenn ein UI-Element langsam lädt oder anders gerendert wird als erwartet.

Sicherheitsmodell: Anthropic's Pro-App-Berechtigungen versus OpenClaws breiter Systemzugriff. Für Einzelanwender, die sensible Aufgaben ausführen, ist Claudes Modell konzeptionell sicherer. Für Teams, die strukturierte Automatisierung in Sandbox-Umgebungen betreiben, ist OpenClaws Ansatz akzeptabel, wenn du die Sicherheitsarbeit geleistet hast.

Fernbedienung: Computer Use koppelt sich mit Anthropic's Dispatch-Funktion — du kannst Aufgaben von deinem iPhone zuweisen und zu fertiger Arbeit auf deinem Desktop zurückkehren. OpenClaw hat keinen nativen mobilen Auslösemechanismus, obwohl du einen über Telegram- oder WhatsApp-Integrationen einrichten kannst.

Kosten: Computer Use erfordert ein Claude Pro ($17/Monat) oder Max ($100-$200/Monat) Abonnement. OpenClaw ist kostenlos und open-source, wobei du für die zugrunde liegenden Modell-API-Aufrufe bezahlst — die sich schnell summieren können, wenn du häufig komplexe Aufgaben ausführst.

Das Fazit: Wenn du einen universellen Desktop-Agenten willst, der vielfältige, einmalige Aufgaben mit minimalem Setup bewältigt, ist Computer Use aktuell die bessere Wahl. Wenn du hochzuverlässige, wiederholbare Automatisierung für bestimmte Workflows brauchst — und du die technischen Fähigkeiten hast, es zu konfigurieren — gibt dir OpenClaw mehr Kontrolle.

Wenn du lieber jemanden hättest, der ein maßgeschneidertes Automatisierungssetup für deinen Workflow baut, übernehme ich KI-Integrationsprojekte. Schau dir an, was ich gebaut habe auf fiverr.com/s/EgxYmWD.

Das Gespräch über Jobverlust, das niemand ehrlich führen will

Anthropic's CEO Dario Amodei sagte Axios letztes Jahr, dass KI die Hälfte aller Einstiegspositionen im Bürobereich innerhalb von fünf Jahren eliminieren könnte — und die Arbeitslosigkeit möglicherweise auf 10-20% treiben könnte. Diese Vorhersage machte Schlagzeilen, zog Kritik auf sich und wurde von den meisten Menschen in ihrem Ordner "beängstigende KI-Vorhersagen" abgelegt.

Nach einer Woche mit Computer Use denke ich, dass Amodeis Zeitrahmen vielleicht zu aggressiv ist, aber seine Richtung stimmt. Und der Mechanismus ist spezifischer, als sich die meisten Menschen vorstellen.

Computer Use ersetzt keinen Software-Ingenieur. Es ersetzt keinen Anwalt oder Finanzanalysten. Was es ersetzt, ist die routinemäßige Ausführungsschicht dieser Berufe — die Stunden, die für Aufgaben aufgewendet werden, die Computerkenntnisse, aber keine tiefe Expertise erfordern. Anschreiben verfassen. Meetings planen. Recherchen in Berichte zusammenstellen. Formulare ausfüllen. Standardisierte E-Mails senden. Tabellen aktualisieren.

Laut Anthropic's eigener Forschung, veröffentlicht im März 2026, hat KI zwar noch keine Arbeitsplätze in nennenswertem Umfang eliminiert, aber es gibt "suggestive Hinweise, dass die Einstellung jüngerer Arbeitnehmer" in exponierten Berufen bereits nachgelassen hat — insbesondere bei den 22- bis 25-Jährigen. Die Jobs verschwinden nicht über Nacht. Die Pipeline verengt sich.

Hier ist die ehrliche Spannung, mit der ich ringe: Als Entwickler und KI-Bauer macht Computer Use meine Arbeit effizienter. Ich spare echte Zeit. Ich erledige Dinge, während ich nicht am Schreibtisch bin. Mein Output pro Stunde ist messbar gestiegen.

Aber ich weiß auch, dass "Einstiegsentwickler, der Routineaufgaben erledigt" genau die Art von Rolle ist, die Computer Use überflüssig macht. Das Junior-Teammitglied, das Boilerplate-Code schreibt, die CI pipeline verwaltet und Status-Update-E-Mails sendet? Diese gesamte Stellenbeschreibung ist jetzt ein Prompt.

Ich habe keine saubere Antwort darauf. Was ich habe, ist eine Beobachtung: Die Menschen, die neben diesen Tools gedeihen werden, sind diejenigen, die verstehen, was die KI tut — gut genug, um sie zu lenken, ihre Fehler zu erkennen und die Aufgaben zu übernehmen, die sie nicht kann. Die Metafähigkeit ist nicht Programmieren oder Schreiben oder Recherchieren — es ist zu wissen, wann man der KI vertrauen kann und wann man eingreifen muss. Diese Beurteilungsschicht ist, vorerst, unersetzbar.

Was nicht funktioniert hat — Der ehrliche Fehlerbericht

Nicht alles hat funktioniert. Und die Fehlschläge sind genauso lehrreich wie die Erfolge.

UI-Timing-Probleme. Computer Use macht Screenshots in Intervallen, und wenn eine Seite langsam lädt oder ein Modal zwischen Screenshots erscheint, kann Claude es komplett verpassen. Ich sah zu, wie es auf einen Button klickte, der bereits durch einen Lade-Spinner ersetzt worden war, was eine unbeabsichtigte Aktion auslöste. Das passierte dreimal während der Woche, immer bei JavaScript-lastigen Webanwendungen mit dynamischem Content.

Context window-Druck. Ausgedehnte mehrstufige Aufgaben stoßen an Claudes Kontextgrenzen. Als Claude bei Schritt 8 einer 12-Schritte-Aufgabe ankam, hatte es so viele Tokens für die Verarbeitung von Screenshots verbraucht, dass seine Antworten spürbar weniger präzise wurden. Lange Aufgaben in kleinere Stücke aufzuteilen funktioniert, aber es untergräbt das Versprechen "sag es einmal und geh weg".

Zwei-Faktor-Authentifizierung als Reibungspunkt. Jede Aufgabe, die 2FA erfordert, unterbricht den Automatisierungsfluss. Claude kann nicht auf deinem Telefon auf "Bestätigen" tippen. Jede 2FA-Aufforderung wird zu einem manuellen Eingriffspunkt, was bedeutet, dass stark gesicherte Dienste (Banking, E-Mail, Cloud-Plattformen) nicht so reibungslos automatisiert werden wie weniger gesicherte. Die Ironie entgeht mir nicht — je sicherheitsbewusster der Dienst, desto schwieriger ist es für KI, ihn zu automatisieren.

Falsche Identifizierung ähnlicher UI-Elemente. Claude klickte gelegentlich auf den falschen Button, wenn zwei Buttons visuell ähnlich aussahen. In einem Fall klickte es auf "Löschen" statt auf "Herunterladen", weil beide Buttons an derselben Stelle in aufeinanderfolgenden Dialogfenstern waren. Es gingen keine Daten verloren — die Aktion hatte einen Bestätigungsschritt — aber es war eine deutliche Erinnerung daran, dass visionsbasierte Interaktion grundsätzlich weniger zuverlässig ist als API-basierte Automatisierung.

Nur-Mac-Einschränkung. Das ist ein Dealbreaker für viele Entwickler. Wenn du Windows oder Linux als primäre Entwicklungsumgebung nutzt, existiert Computer Use für dich schlichtweg noch nicht. Meine Hauptentwicklungsmaschine läuft auf macOS, also war das für mich kein Problem, aber es schließt einen großen Teil der potenziellen Nutzerbasis aus.

Das sind keine theoretischen Grenzfälle. Sie sind bei normalem Gebrauch passiert, bei normalen Aufgaben. Computer Use ist beeindruckend, wirklich nützlich und eindeutig noch nicht bereit, unbeaufsichtigt mit etwas Geschäftskritischem betraut zu werden. Anthropic kennzeichnet es als "Research Preview" aus gutem Grund, und diese Kennzeichnung ist ehrlich.

Das größere Bild — Was das für KI-Agenten verändert

Tritt von den spezifischen Funktionen zurück, und etwas Größeres kommt in den Blick.

In den letzten drei Jahren waren KI-Assistenten auf Textfelder beschränkt. Du hast beschrieben, was du wolltest, die KI hat Text oder Code generiert, und du hast die Ausgabe in die Anwendung kopiert, die sie brauchte. Der Mensch diente als Brücke zwischen den Fähigkeiten der KI und der Oberfläche des Computers. Du warst die Middleware.

Computer Use, OpenClaw, Googles Autobrowse und die Welle von Browser-Agenten und Desktop-Agenten, die 2026 kommen — sie alle eliminieren die Middleware. Die KI spricht direkt mit deinem Computer. Sie sieht, was du siehst, klickt, wo du klicken würdest, und navigiert, wohin du navigieren würdest.

Diese Verschiebung von "KI generiert Output" zu "KI führt Aktionen aus" ist die bedeutendste Fähigkeitsveränderung, seit große Sprachmodelle begannen, kohärenten Text zu schreiben. Generierung ist nützlich. Ausführung ist transformativ. Und wir stehen erst am Anfang herauszufinden, wie diese Transformation aussieht.

Die Tools, die Unternehmen in diesem Bereich bauen — SerpAPI, das strukturierte Suchdaten an KI-Agenten liefert, Nvidia, das strukturierte Datenpipelines beschleunigt, Shopify, das agentische Storefronts baut — setzen alle auf dieselbe These: KI-Agenten, die in der Welt handeln können, brauchen zuverlässige Dateninfrastruktur, um gut zu handeln. Die Leitungen werden gerade verlegt, und Computer Use ist die sichtbare Spitze eines viel größeren Eisbergs.

Was ich am genauesten beobachte, ist die Konvergenz von Computer Use, persistentem Gedächtnis und Multi-Agenten-Koordination. Aktuell erledigt Computer Use einzelne Aufgaben auf einem Rechner. Aber Anthropic hat bereits Agent Teams, die mehrere Claude-Instanzen parallel betreiben. Verbinde diese Agenten mit Computer Use, gib ihnen persistentes Gedächtnis über Sitzungen hinweg, und du schaust auf ein System, das einen gesamten Workflow managen kann — keine Aufgabe, einen Workflow — über Tage und Anwendungen hinweg ohne menschlichen Eingriff.

Das ist keine Science-Fiction. Jedes einzelne Teil existiert heute. Die Integration ist das, was kommt.

Wer das jetzt nutzen sollte — Und wer warten sollte

Nutze Computer Use jetzt, wenn:

Du macOS verwendest und bereits für Claude Pro oder Max bezahlst
Du regelmäßig Zeit mit repetitiven, anwendungsübergreifenden Aufgaben verbringst (Recherche zusammenstellen, E-Mails entwerfen, Termine planen)
Du Aufgaben delegieren willst, während du nicht am Schreibtisch bist (harmoniert wunderbar mit Dispatch)
Du dich damit wohlfühlst, KI-Aktionen zu überwachen und gelegentliche Fehler aufzufangen
Du KI-gestützte Workflows baust und den Stand der Technik verstehen willst

Warte, wenn:

Du Windows- oder Linux-Unterstützung brauchst
Deine kritischen Workflows von hochsicheren Diensten mit obligatorischer 2FA abhängen
Du 100% Zuverlässigkeit bei automatisierten Aufgaben brauchst (nutze stattdessen OpenClaw mit getesteten Action Schemas)
Du dich nicht damit wohlfühlst, dass eine KI Bildschirmzugriff auf deine Anwendungen hat
Du mit sensiblen Kundendaten arbeitest und dir über die Compliance-Implikationen nicht sicher bist

Die ehrliche Wahrheit? Ich lasse es eingeschaltet. Die Zeitersparnis ist real — ich schätze 4-6 Stunden pro Woche bei den Aufgaben, die ich automatisiert habe — und die Möglichkeit, Arbeit von meinem Telefon aus anzustoßen, während ich nicht am Schreibtisch bin, hat bereits verändert, wie ich meine Tage strukturiere. Aber ich behalte jede Aufgabe, die es ausführt, genau im Auge, und ich gebe ihm keinen Zugriff auf Finanzanwendungen mehr ohne ein deutlich robusteres Sicherheitsnetz.

Die Frage, über die es sich lohnt nachzudenken

Vor einer Woche bedeutete "KI-Assistent" etwas, das in einem Chatfenster lebte, Fragen beantwortete und Text generierte, den ich woanders hin kopierte. Heute, an meinem Schreibtisch sitzend, nachdem ich sieben Tage lang zugesehen habe, wie Claude physisch meinen Computer bediente — Apps öffnete, Buttons klickte, E-Mails sendete, an Meetings teilnahm — fühlt sich diese Definition an, als gehöre sie in eine andere Ära.

Die Kluft zwischen "KI, die spricht" und "KI, die handelt" ist die Kluft zwischen einem Kollegen, der Ratschläge gibt, und einem Kollegen, der die Arbeit erledigt. Wir haben sie gerade überquert. Nicht perfekt. Nicht sicher genug. Nicht für jeden. Aber die Überquerung ist geschehen, und es gibt kein Zurück.

Die Frage ist nicht, ob KI-Agenten unsere Computer bedienen werden. Das ist geklärt — sie tun es bereits. Die Frage ist: Wenn du deine Maus und Tastatur an eine Intelligenz übergibst, die jeden Button klicken, jede App öffnen und jede Nachricht senden kann — was genau vertraust du dann, und was passiert, wenn dieses Vertrauen falsch ist?

Ich habe noch keine vollständige Antwort. Aber ich weiß Folgendes: Die Menschen, die jetzt anfangen, diese Antwort zu erarbeiten, während die Technologie jung und die Risiken noch handhabbar sind, werden weit besser vorbereitet sein als diejenigen, die warten, bis es zu spät ist, die Frage zu stellen.

Häufig gestellte Fragen

Was ist Anthropic Computer Use und wie funktioniert es?

Anthropic Computer Use ist eine Funktion, mit der Claude AI deinen Mac steuern kann, indem es Screenshots macht, interpretiert, was auf dem Bildschirm zu sehen ist, und Mausklicks sowie Tastatureingaben ausführt — genau wie ein Mensch. Es ist als Research Preview für Claude Pro ($17/Monat) und Max ($100-$200/Monat) Abonnenten verfügbar, ausschließlich auf macOS.

Ist Claude Computer Use sicher für sensible Anwendungen?

Claude erfordert eine Pro-App-Genehmigung, bevor es auf eine Anwendung zugreift, was den Schadensradius von Fehlern oder Angriffen begrenzt. Allerdings bleibt prompt injection eine nachgewiesene Schwachstelle, und Anthropic räumt ein, dass die Funktion noch früh ist. Vermeide es, Banking- oder sensiblen Anwendungen Zugriff zu gewähren, bis das Sicherheitsmodell ausgereift ist. Für einen tieferen Einblick in die Sicherheit von KI-Agenten, siehe xCyberSecurity's Bewertungsressourcen.

Wie schneidet Computer Use im Vergleich zu OpenClaw ab?

Computer Use ist einfacher einzurichten (Minuten vs. Stunden), nur Mac, an Claude gebunden und nutzt ein sichereres Pro-App-Berechtigungsmodell. OpenClaw ist open-source, modellagnostisch, zuverlässiger für wiederholbare Automatisierung, erfordert aber Docker- und CLI-Kenntnisse. Siehe den vollständigen Vergleich im Abschnitt oben.

Wird Anthropic Computer Use menschliche Arbeitsplätze ersetzen?

Anthropic's CEO prognostiziert, dass KI 50% aller Einstiegspositionen im Bürobereich innerhalb von fünf Jahren eliminieren könnte. Computer Use zielt speziell auf die routinemäßige Ausführungsschicht ab — Terminplanung, E-Mail, Recherchezusammenstellung, Formulare ausfüllen — und nicht auf Rollen, die tiefe Expertise erfordern. Frühe Daten aus Anthropic's Forschung vom März 2026 zeigen, dass die Einstellung von 22- bis 25-Jährigen in KI-exponierten Berufen bereits nachgelassen hat.

Funktioniert Computer Use unter Windows oder Linux?

Nein. Stand März 2026 ist Computer Use nur für macOS verfügbar. Windows-Unterstützung ist geplant, hat aber kein öffentliches Veröffentlichungsdatum. Linux-Unterstützung wurde nicht angekündigt.

Lass uns zusammenarbeiten

Du möchtest KI-Systeme bauen, Workflows automatisieren oder deine technische Infrastruktur skalieren? Ich helfe gerne.

Fiverr (custom builds & integrations): fiverr.com/s/EgxYmWD
Portfolio: mejba.me
Ramlit Limited (enterprise solutions): ramlit.com
ColorPark (design & branding): colorpark.io
xCyberSecurity (security services): xcybersecurity.io