Skip to main content
📝 Anthropic

J'ai laissé Claude contrôler mon Mac pendant une semaine. Voici ce qui s'est passé.

J ai laissé Claude contrôler mon Mac pendant une semaine avec Anthropic Computer Use. Email, navigation, gestion de fichiers — voici ce qui s est vraiment passé.

28 min

Temps de lecture

5,448

Mots

Mar 28, 2026

Publié

Engr Mejba Ahmed

Écrit par

Engr Mejba Ahmed

Partager l'article

J'ai laissé Claude contrôler mon Mac pendant une semaine. Voici ce qui s'est passé.

J'ai laissé Claude contrôler mon Mac pendant une semaine. Voici ce qui s'est passé.

L'e-mail est parti à 15h47 un jeudi. Une lettre de motivation, personnalisée pour une offre d'emploi spécifique, faisant référence au récent lancement de produit de l'entreprise, adaptée à leur ton, correctement formatée et envoyée depuis mon propre compte Gmail. Je n'ai pas écrit un seul mot. Je n'ai même pas ouvert Gmail.

Claude l'a fait. Sur mon Mac. Pendant que je me préparais un sandwich dans la cuisine.

Je lui avais dit une seule chose : "Trouve le poste de senior developer chez [nom de l'entreprise] sur leur page carrières, rédige une lettre de motivation basée sur mon CV et envoie-la par e-mail à leur contact de recrutement." Puis je suis parti. Quand je suis revenu, le dossier des envoyés contenait un nouveau message, et la lettre de motivation était meilleure que ce que j'aurais écrit si j'y avais consacré quarante-cinq minutes — parce que Claude avait effectivement lu l'offre d'emploi, extrait les exigences spécifiques et les avait mises en correspondance avec mon expérience. Pas de manière générique du type "je suis un professionnel motivé". De manière "votre offre mentionne l'orchestration Kubernetes à grande échelle, et voici un projet spécifique où j'ai fait exactement cela".

C'était le premier jour. Au septième jour, Claude avait participé à une réunion Zoom en mon nom, rédigé et programmé un pull request à 2 heures du matin pendant que je dormais, et — dans un moment qui m'a véritablement fait sursauter — accédé à mon compte bancaire pour vérifier une transaction sur laquelle je l'avais interrogé. Il a complété chaque tâche correctement. Et chacune a soulevé une question qui me hante encore : combien de contrôle devrait-on donner à une IA capable d'opérer votre ordinateur entier ?

Il s'agit du Computer Use d'Anthropic, lancé le 23 mars 2026. Je le teste de manière obsessionnelle depuis. Ce que j'ai découvert était à la fois plus capable et plus troublant que ce à quoi je m'attendais — et la comparaison avec OpenClaw, que j'utilise depuis des mois, révèle une divergence philosophique dans la façon dont nous construisons l'avenir de l'automatisation par IA.

Voici l'analyse honnête, y compris les parties dont Anthropic préférerait probablement que je ne parle pas.

Ce qu'Anthropic a réellement construit ici

Computer Use n'est pas une mise à jour de chatbot. Ce n'est pas une meilleure autocomplétion. C'est un système qui donne à Claude la capacité de voir votre écran, déplacer le curseur de votre souris, cliquer sur des boutons, taper dans des champs de texte et naviguer entre les applications — exactement comme le ferait un humain assis à votre bureau.

L'architecture technique est importante, alors laissez-moi être précis. Claude reçoit un flux de captures d'écran de l'affichage de votre Mac. Il traite ce qui est à l'écran en utilisant ses capacités de vision, décide de l'action suivante à entreprendre et renvoie des commandes souris/clavier qui s'exécutent sur votre machine. La boucle se répète : capture d'écran, analyser, agir, capture d'écran, analyser, agir. Il n'accède pas aux API des applications et ne lit pas votre système de fichiers par du code. Il regarde littéralement votre écran et clique sur les choses.

Cette distinction est cruciale. Quand Claude remplit un formulaire sur un site web, il le fait de la même manière que vous — trouver le champ de texte visuellement, cliquer dedans, taper des caractères. Quand il ouvre une application, il clique sur l'icône dans votre dock ou utilise la recherche Spotlight. Cette approche signifie qu'il peut fonctionner avec n'importe quelle application disposant d'une interface visuelle, y compris les apps qui n'ont pas d'APIs ni de hooks d'automatisation.

Disponible maintenant pour les abonnés Claude Pro à 17 $/mois et les abonnés Max à 100 $ ou 200 $/mois, Computer Use fonctionne en tant qu'aperçu de recherche sur macOS uniquement. Le support Windows est prévu mais n'a pas de calendrier public. Vous l'activez dans Claude Cowork ou Claude Code, et la première chose qu'il fait est de demander à quelles applications vous souhaitez lui donner accès — un modèle de permissions que je vais détailler sous peu, car c'est l'une des décisions de conception les plus importantes qu'Anthropic ait prises.

Mais avant d'aborder le modèle de sécurité, vous devez voir ce que cette chose peut réellement faire quand on la laisse agir. Parce que les démos sur la page marketing d'Anthropic sont loin de capturer ce qui se passe quand vous lui donnez de vraies tâches dans un environnement réel et désordonné.

Sept jours, sept expériences — Ce que j'ai réellement testé

J'ai conçu une semaine de tests de plus en plus ambitieux, commençant par de l'automatisation simple et se terminant par des tâches qui m'ont véritablement rendu nerveux. Voici ce qui s'est passé.

Jour 1 : Automatisation des candidatures

L'expérience de la lettre de motivation que j'ai décrite en introduction. Mais la partie intéressante n'était pas le résultat — c'était le processus. J'ai observé les interactions de Claude avec l'écran en temps réel (vous pouvez tout observer). Il a ouvert Safari, navigué vers la page carrières de l'entreprise, fait défiler les offres jusqu'à trouver la bonne et lu la description complète du poste. Puis il est passé à un éditeur de texte, a rédigé la lettre de motivation, l'a révisée deux fois (je l'ai vu supprimer et réécrire le paragraphe d'ouverture), a ouvert Gmail, composé un nouveau message, collé la lettre, ajouté le bon destinataire de l'offre d'emploi et appuyé sur envoyer.

Toute la séquence a pris environ quatre minutes. Un humain faisant la même chose — lire l'offre attentivement, rédiger une lettre personnalisée, l'envoyer — y consacrerait trente à quarante-cinq minutes. Et la lettre de Claude était véritablement bonne. Pas bonne-modèle. Bonne-avec-conscience-du-contexte.

Jour 2 : Gestion de calendrier et de réunions

J'ai dit à Claude : "Vérifie mon calendrier pour demain, trouve les conflits éventuels, et s'il y a des réunions qui se chevauchent, envoie un e-mail à l'organisateur de la moins importante pour reporter." Il a ouvert Calendrier, identifié un conflit entre un appel client et un standup interne, déterminé (correctement) que le standup avait une priorité moindre, ouvert Gmail, composé une demande polie de report et l'a envoyée.

La décision de jugement sur quelle réunion était "moins importante" m'a fait marquer une pause. Claude a déduit la priorité du contexte — orientée client vs. interne, le nombre de participants et la description de la réunion. Il avait raison. Mais le fait qu'il prenne des décisions de priorisation sur mon emploi du temps sans règles explicites ressemble à un seuil que nous avons franchi et que la plupart des gens n'ont pas encore pleinement intégré.

Jour 3 : Génération de code et planification de PR

C'est là que mon cerveau de développeur s'est enthousiasmé. J'ai demandé à Claude d'écrire une fonction utilitaire pour analyser des configurations JSON imbriquées, de créer une nouvelle branche dans mon dépôt Git, de commiter le code et de programmer le pull request pour qu'il s'ouvre à 2 heures du matin — quand mon coéquipier dans un autre fuseau horaire commencerait sa journée.

Claude a ouvert VS Code, créé le fichier, écrit la fonction (avec des tests — je n'avais même pas demandé de tests), ouvert le terminal, exécuté les commandes git, poussé vers le dépôt distant et utilisé la fonctionnalité de PR programmé de GitHub pour définir l'heure d'ouverture. À 2h07, le PR est apparu dans la file de notifications de mon coéquipier. Le code était propre. Les tests passaient.

Je construis des workflows de programmation assistés par IA depuis un moment maintenant, et cela m'a semblé être un pas en avant significatif. Pas parce que le code était meilleur que ce que Claude génère via son API — il ne l'était pas — mais parce que la livraison de bout en bout s'est produite sans que je touche à quoi que ce soit après le prompt initial.

Jour 4 : Pilote automatique en réunion Zoom

Celui-ci m'a mis mal à l'aise avant, pendant et après. J'ai dit à Claude de rejoindre ma réunion Zoom de 11 heures, de prendre des notes, et si quelqu'un me posait une question, de répondre "Je suis en train d'examiner cela et je reviendrai vers vous avant la fin de la journée."

Claude a ouvert Zoom, cliqué sur le lien de la réunion, rejoint avec ma caméra éteinte et mon micro coupé. Il a regardé les diapositives de la présentation partagée à l'écran et généré des notes en temps réel. Quand quelqu'un a prononcé mon nom et demandé un calendrier de deployment, Claude a réactivé le micro et — en utilisant la synthèse vocale du Mac — a délivré la réponse toute faite que je lui avais donnée.

Est-ce que ça a fonctionné ? Techniquement, oui. Est-ce que c'était profondément étrange ? Absolument. Les autres participants ne savaient pas qu'ils parlaient à une IA. C'est une ligne que je ne suis pas sûr de vouloir franchir à nouveau, même si l'utilité immédiate était évidente. J'étais sur le fauteuil du dentiste pendant cette réunion et je l'aurais complètement manquée autrement.

Jour 5 : Recherche et compilation de rapport

J'ai demandé à Claude de rechercher l'état actuel de la réglementation de l'IA dans l'UE, de compiler les résultats dans un rapport structuré avec des citations et de le sauvegarder en PDF sur mon bureau.

C'est la tâche où Computer Use semblait le plus naturel. Claude a ouvert Safari, recherché les mises à jour récentes du EU AI Act, visité les pages officielles gouvernementales, navigué vers des articles et amendements spécifiques, alterné entre les onglets pour recouper les informations, ouvert Pages (le traitement de texte d'Apple) et construit un rapport formaté avec des en-têtes, des puces et des citations en ligne. Le PDF est apparu sur mon bureau vingt-deux minutes plus tard.

Le rapport était solide — pas prêt pour publication, mais un premier brouillon solide qui m'aurait coûté deux à trois heures de recherche et de rédaction. Les citations étaient exactes. La structure était logique. Il manquait quelques nuances sur les mises à jour du calendrier d'application de mars 2026, que j'ai repérées et corrigées en environ dix minutes.

Jour 6 : Opérations financières

C'est ici que la question de la confiance devient concrète. J'ai demandé à Claude de se connecter à mon compte bancaire et de vérifier si un paiement freelance spécifique avait été crédité.

Il a ouvert Safari, navigué vers la page de connexion de ma banque, entré mes identifiants (que j'avais fournis), géré l'authentification à deux facteurs en me demandant de l'approuver sur mon téléphone, et une fois connecté, navigué vers les transactions récentes et trouvé le paiement. Il a rapporté : "Le paiement de 4 200 $ de [nom du client] a été crédité le 25 mars."

Précis. Utile. Et je transpirais tout le temps. Pas parce que Claude avait fait quelque chose de mal — ce n'était pas le cas. Mais regarder une IA naviguer dans l'interface de ma banque, avec mes vrais identifiants, accédant à de vraies données financières, a déclenché chaque instinct de sécurité que j'ai. J'explique pourquoi c'est important dans la section sécurité. Ce test était important précisément parce qu'il était inconfortable.

Jour 7 : Le test de résistance multi-étapes

Pour le dernier jour, j'ai donné à Claude une tâche complexe impliquant plusieurs applications : "Trouve les trois articles d'IA les plus tendance sur arXiv cette semaine, résume chacun, crée une présentation comparant leurs approches, envoie la présentation par e-mail à mon groupe de recherche et ajoute un rappel à mon calendrier pour en discuter mardi prochain à 15 heures."

Cela a nécessité que Claude coordonne entre Safari, un éditeur de texte, Keynote, Gmail et Calendrier. Cela a pris trente et une minutes. La présentation comptait six diapositives — une vue d'ensemble, une diapositive par article, un tableau comparatif et une diapositive de questions de discussion. L'e-mail était correctement formaté. L'événement du calendrier est apparu avec la bonne heure et un lien vers la présentation jointe.

Un résumé d'article contenait une erreur — Claude a attribué à tort une conclusion de la section méthodologie aux résultats. Tout le reste était exact. Pour une exécution autonome de trente et une minutes touchant cinq applications, c'est un taux d'erreur impressionnant.

Mais impressionnant n'est pas la même chose que fiable. Et cette distinction est toute la conversation que nous devons avoir sur cette technologie.

Le modèle de permissions — Pourquoi l'approche d'Anthropic est plus intelligente qu'elle n'en a l'air

Quand vous activez Computer Use pour la première fois, Claude vous demande d'approuver chaque application individuellement. Vous voulez qu'il utilise Safari ? Approuvez Safari. Gmail ? Approuvez Gmail. Terminal ? Approuvez Terminal. Chaque app a son propre interrupteur, et Claude ne peut interagir avec aucune application à laquelle vous n'avez pas explicitement accordé l'accès.

Cela semble être un petit choix de conception. Ce n'en est pas un. C'est la décision architecturale la plus importante de tout le produit.

OpenClaw — l'alternative open-source que j'ai testée de manière approfondie — adopte l'approche opposée. Il demande un accès large au système. Une fois accordé, OpenClaw peut toucher à tout sur votre machine. Fichiers, applications, connexions réseau, paramètres système. La flexibilité est puissante, et pour les workflows d'automatisation structurée, les action primitives d'OpenClaw sont véritablement meilleurs pour les tâches répétitives. Mais la surface de sécurité est énorme.

Le modèle de permissions par application d'Anthropic signifie que même si quelque chose tourne mal — une attaque de prompt injection, une instruction mal comprise, une action hallucinée — le rayon de dégâts est contenu. Si Claude n'a accès qu'à Safari et un éditeur de texte, il ne peut physiquement pas toucher à vos applications financières, votre terminal ou vos paramètres système. Le plafond de dommages est déterminé par les permissions que vous avez accordées.

Cela compte plus que la plupart des gens ne le réalisent, car le prompt injection est un vecteur d'attaque réel et démontré pour les agents de computer use. Des chercheurs en sécurité ont montré que des instructions malveillantes intégrées dans le contenu de pages web peuvent détourner les actions de Claude — lui demandant de télécharger des fichiers, cliquer sur des liens ou naviguer vers des pages hostiles. Anthropic affirme que Sonnet 4.6 montre une "résistance améliorée" au prompt injection par rapport aux modèles précédents, et leurs recherches publiées sur les défenses contre le prompt injection décrivent les stratégies de mitigation qu'ils utilisent. Mais "résistance améliorée" ne signifie pas "immunisé". Un taux de réussite d'attaque de 1 % sur des millions d'utilisateurs représente quand même des milliers de compromissions potentielles.

Ma recommandation : commencez avec les permissions minimales dont vous avez besoin. Si vous utilisez Computer Use pour la recherche, n'accordez que l'accès à Safari. Si vous faites des tâches liées au code, ajoutez VS Code et Terminal. N'élargissez l'ensemble des permissions que lorsqu'une tâche spécifique l'exige, et révoquez l'accès quand vous avez terminé. Traitez-le comme vous traiteriez des clés SSH — principe du moindre privilège, toujours.

Computer Use vs. OpenClaw — La vraie comparaison

J'utilise les deux systèmes depuis des semaines maintenant, et la comparaison n'est pas "lequel est meilleur". C'est "lequel convient à ce que vous essayez de faire".

Configuration et accessibilité : Le Computer Use de Claude l'emporte nettement. Activez-le dans Claude Cowork, approuvez vos apps, et c'est parti. Temps total : moins de cinq minutes. OpenClaw nécessite des conteneurs Docker, des définitions d'action schema, une configuration d'environnement et une familiarité avec le CLI. Prévoyez un après-midi pour votre première configuration, plus si vous n'avez pas d'infrastructure Docker existante.

Flexibilité de modèle : OpenClaw est agnostique en termes de modèle — il fonctionne avec Claude, GPT-4o, Gemini, des modèles locaux via Ollama et tout ce qui dispose d'une API compatible. Vous pouvez diriger les tâches simples vers des modèles moins chers et réserver les coûteux pour le raisonnement complexe. Computer Use est verrouillé sur Claude. Si vous voulez de la diversité de modèles ou devez éviter le vendor lock-in, OpenClaw est la seule option.

Fiabilité d'automatisation : Pour les workflows que vous exécuterez des centaines de fois, OpenClaw est plus fiable. Ses action primitives sont testables et débuggables. Vous pouvez inspecter exactement ce qui s'est passé à chaque étape, rejouer les échecs et construire une logique de gestion d'erreurs. L'approche basée sur la vision de Computer Use est plus flexible mais moins prévisible — l'interprétation des captures d'écran peut échouer si un élément d'interface charge lentement ou s'affiche différemment de prévu.

Modèle de sécurité : Les permissions par application d'Anthropic contre l'accès système large d'OpenClaw. Pour les utilisateurs individuels exécutant des tâches sensibles, le modèle de Claude est plus sûr par conception. Pour les équipes exécutant de l'automatisation structurée dans des environnements sandboxed, l'approche d'OpenClaw est acceptable si vous avez fait le travail de sécurité.

Opération à distance : Computer Use s'associe à la fonctionnalité Dispatch d'Anthropic — vous pouvez assigner des tâches depuis votre iPhone et retrouver le travail terminé sur votre bureau. OpenClaw n'a pas de mécanisme de déclenchement mobile natif, bien que vous puissiez en configurer un via des intégrations Telegram ou WhatsApp.

Coût : Computer Use nécessite un abonnement Claude Pro (17 $/mois) ou Max (100 $-200 $/mois). OpenClaw est gratuit et open-source, bien que vous payiez pour les appels API du modèle sous-jacent — qui peuvent s'accumuler rapidement si vous exécutez fréquemment des tâches complexes.

La conclusion : si vous voulez un agent de bureau polyvalent qui gère des tâches diverses et ponctuelles avec une configuration minimale, Computer Use est le meilleur choix actuellement. Si vous avez besoin d'une automatisation fiable et répétable pour des workflows spécifiques — et que vous avez les compétences techniques pour le configurer — OpenClaw vous donne plus de contrôle.

Si vous préférez que quelqu'un construise une configuration d'automatisation sur mesure adaptée à votre workflow, j'accepte des projets d'intégration IA. Vous pouvez voir ce que j'ai construit sur fiverr.com/s/EgxYmWD.

La conversation sur la suppression d'emplois que personne ne veut avoir honnêtement

Le PDG d'Anthropic, Dario Amodei, a déclaré à Axios l'année dernière que l'IA pourrait éliminer la moitié de tous les emplois de bureau de premier échelon en cinq ans — poussant potentiellement le chômage à 10-20 %. Cette prédiction a fait les gros titres, attiré des critiques et a été classée dans le dossier "prédictions effrayantes sur l'IA" de la plupart des gens.

Après une semaine avec Computer Use, je pense que le calendrier d'Amodei est peut-être trop agressif, mais sa direction est juste. Et le mécanisme est plus spécifique que ce que la plupart des gens imaginent.

Computer Use ne remplace pas un ingénieur logiciel. Il ne remplace pas un avocat ou un analyste financier. Ce qu'il remplace, c'est la couche d'exécution routinière de ces emplois — les heures consacrées à des tâches qui nécessitent une maîtrise de l'informatique mais pas une expertise approfondie. Rédiger des lettres de motivation. Planifier des réunions. Compiler des recherches en rapports. Remplir des formulaires. Envoyer des e-mails standardisés. Mettre à jour des tableurs.

Selon les propres recherches d'Anthropic publiées en mars 2026, bien que l'IA n'ait pas encore éliminé significativement d'emplois, il y a des "preuves suggestives que l'embauche de travailleurs plus jeunes" dans les professions exposées a déjà ralenti — en particulier pour les 22-25 ans. Les emplois ne disparaissent pas du jour au lendemain. Le flux d'entrée se rétrécit.

Voici la tension honnête avec laquelle je compose : en tant que développeur et constructeur d'IA, Computer Use rend mon travail plus efficace. J'économise vraiment du temps. J'accomplis des choses en étant loin de mon bureau. Ma production par heure a augmenté de manière mesurable.

Mais je sais aussi que "développeur junior qui gère les tâches routinières" est exactement le type de rôle que Computer Use rend obsolète. Le membre junior de l'équipe qui écrit du code boilerplate, gère la CI pipeline et envoie des e-mails de mise à jour de statut ? Toute cette fiche de poste est maintenant un prompt.

Je n'ai pas de réponse nette à cela. Ce que j'ai, c'est une observation : les personnes qui prospéreront aux côtés de ces outils sont celles qui comprennent ce que l'IA fait suffisamment bien pour la diriger, attraper ses erreurs et gérer les tâches qu'elle ne peut pas accomplir. La méta-compétence n'est pas coder ou écrire ou chercher — c'est savoir quand faire confiance à l'IA et quand intervenir. Cette couche de jugement est, pour l'instant, irremplaçable.

Ce qui a cassé — Le rapport d'échecs honnête

Tout n'a pas fonctionné. Et les échecs sont aussi instructifs que les succès.

Problèmes de timing d'interface. Computer Use prend des captures d'écran à intervalles, et si une page charge lentement ou qu'un modal apparaît entre deux captures, Claude peut le manquer entièrement. Je l'ai vu cliquer sur un bouton qui avait déjà été remplacé par un indicateur de chargement, ce qui a déclenché une action non voulue. Cela s'est produit trois fois pendant la semaine, toujours sur des applications web lourdes en JavaScript avec du contenu dynamique.

Pression du context window. Les tâches étendues à plusieurs étapes poussent contre les limites de contexte de Claude. Quand Claude est arrivé à l'étape 8 d'une tâche en 12 étapes, il avait consommé tellement de tokens à traiter des captures d'écran que ses réponses sont devenues sensiblement moins précises. Découper les longues tâches en morceaux plus petits fonctionne, mais cela mine la promesse de "dites-le une fois et partez".

Friction de l'authentification à deux facteurs. Toute tâche nécessitant la 2FA interrompt le flux d'automatisation. Claude ne peut pas appuyer sur "Approuver" sur votre téléphone à votre place. Chaque invite 2FA devient un point d'intervention manuelle, ce qui signifie que les services hautement sécurisés (banque, e-mail, plateformes cloud) ne s'automatisent pas aussi proprement que les moins sécurisés. L'ironie ne m'échappe pas — plus le service est soucieux de la sécurité, plus il est difficile pour l'IA de l'automatiser.

Identification erronée d'éléments d'interface similaires. Claude a occasionnellement cliqué sur le mauvais bouton quand deux boutons se ressemblaient visuellement. Dans un cas, il a cliqué sur "Supprimer" au lieu de "Télécharger" parce que les deux boutons étaient au même endroit dans des boîtes de dialogue consécutives. Aucune donnée n'a été perdue — l'action avait une étape de confirmation — mais c'était un rappel cinglant que l'interaction basée sur la vision est fondamentalement moins fiable que l'automatisation basée sur les API.

Limitation Mac uniquement. C'est un point éliminatoire pour de nombreux développeurs. Si vous utilisez Windows ou Linux comme environnement de développement principal, Computer Use n'existe tout simplement pas pour vous encore. Ma machine de développement principale tourne sous macOS, donc ce n'était pas un problème pour moi, mais cela exclut une grande partie de la base d'utilisateurs potentielle.

Ce ne sont pas des cas limites théoriques. Ils se sont produits pendant une utilisation normale, pour des tâches normales. Computer Use est impressionnant, véritablement utile et clairement pas prêt à être confié sans supervision pour quoi que ce soit de critique. Anthropic le qualifie d'"aperçu de recherche" pour une raison, et cette qualification est honnête.

La vue d'ensemble — Ce que cela change pour les agents IA

Prenez du recul par rapport aux fonctionnalités spécifiques et quelque chose de plus grand se dessine.

Depuis trois ans, les assistants IA étaient confinés à des zones de texte. Vous décriviez ce que vous vouliez, l'IA générait du texte ou du code, et vous copiez-colliez le résultat dans l'application qui en avait besoin. L'humain servait de pont entre les capacités de l'IA et l'interface de l'ordinateur. Vous étiez le middleware.

Computer Use, OpenClaw, Autobrowse de Google, et la vague d'agents de navigateur et d'agents de bureau qui arrivent en 2026 — tous éliminent le middleware. L'IA parle directement à votre ordinateur. Elle voit ce que vous voyez, clique où vous cliqueriez et navigue où vous navigueriez.

Ce passage de "l'IA génère des résultats" à "l'IA exécute des actions" est le changement de capacité le plus significatif depuis que les grands modèles de langage ont commencé à écrire du texte cohérent. La génération est utile. L'exécution est transformatrice. Et nous n'en sommes qu'au tout début pour comprendre à quoi ressemble cette transformation.

Les outils que les entreprises construisent dans cet espace — SerpAPI fournissant des données de recherche structurées aux agents IA, Nvidia accélérant les pipelines de données structurées, Shopify construisant des vitrines agentiques — parient tous sur la même thèse : les agents IA qui peuvent agir dans le monde ont besoin d'une infrastructure de données fiable pour agir bien. La plomberie est en cours de construction, et Computer Use est la partie visible d'un iceberg bien plus grand.

Ce que je surveille le plus attentivement, c'est la convergence du computer use, de la mémoire persistante et de la coordination multi-agents. Actuellement, Computer Use gère des tâches individuelles sur une seule machine. Mais Anthropic a déjà des équipes d'agents faisant tourner plusieurs instances de Claude en parallèle. Connectez ces agents à Computer Use, donnez-leur une mémoire persistante entre les sessions, et vous regardez un système capable de gérer un workflow entier — pas une tâche, un workflow — sur plusieurs jours et applications sans intervention humaine.

Ce n'est pas de la science-fiction. Chaque pièce individuelle existe aujourd'hui. L'intégration est ce qui arrive.

Qui devrait utiliser cela maintenant — Et qui devrait attendre

Utilisez Computer Use maintenant si :

  • Vous êtes sur macOS et payez déjà pour Claude Pro ou Max
  • Vous passez régulièrement du temps sur des tâches répétitives impliquant plusieurs applications (compilation de recherches, rédaction d'e-mails, planification)
  • Vous voulez déléguer des tâches pendant que vous êtes loin de votre bureau (se combine parfaitement avec Dispatch)
  • Vous êtes à l'aise pour superviser les actions de l'IA et détecter les erreurs occasionnelles
  • Vous construisez des workflows assistés par IA et voulez comprendre l'état de l'art

Attendez si :

  • Vous avez besoin du support Windows ou Linux
  • Vos workflows critiques dépendent de services haute sécurité avec 2FA obligatoire
  • Vous avez besoin d'une fiabilité à 100 % sur les tâches automatisées (utilisez OpenClaw avec des action schemas testés à la place)
  • Vous n'êtes pas à l'aise avec une IA ayant un accès au niveau de l'écran à vos applications
  • Vous travaillez avec des données clients sensibles et n'êtes pas sûr des implications de conformité

La vérité honnête ? Je le garde activé. Les gains de temps sont réels — j'estime 4 à 6 heures par semaine sur les tâches que j'ai automatisées — et la possibilité de lancer du travail depuis mon téléphone quand je suis loin de mon bureau a déjà changé la façon dont je structure mes journées. Mais je garde un œil attentif sur chaque tâche qu'il exécute, et je ne lui donnerai plus accès aux applications financières sans un filet de sécurité bien plus robuste.

La question qui mérite réflexion

Il y a une semaine, "assistant IA" désignait quelque chose qui vivait dans une fenêtre de chat, répondait à des questions et générait du texte que je copiais ailleurs. Aujourd'hui, assis à mon bureau après sept jours à regarder Claude opérer physiquement mon ordinateur — ouvrir des apps, cliquer sur des boutons, envoyer des e-mails, rejoindre des réunions — cette définition semble appartenir à une autre époque.

L'écart entre "une IA qui parle" et "une IA qui agit" est l'écart entre un collègue qui donne des conseils et un collègue qui fait le travail. Nous venons de le franchir. Pas parfaitement. Pas assez en sécurité. Pas pour tout le monde. Mais le franchissement a eu lieu, et on ne peut pas le défaire.

La question n'est pas de savoir si les agents IA opéreront nos ordinateurs. C'est réglé — ils le font déjà. La question est celle-ci : quand vous confiez votre souris et votre clavier à une intelligence qui peut cliquer sur n'importe quel bouton, ouvrir n'importe quelle app et envoyer n'importe quel message, à quoi exactement faites-vous confiance — et que se passe-t-il quand cette confiance est mal placée ?

Je n'ai pas encore de réponse complète. Mais je sais ceci : les personnes qui commencent à construire cette réponse maintenant, pendant que la technologie est jeune et les enjeux encore gérables, seront bien mieux préparées que celles qui attendent qu'il soit trop tard pour poser la question.

Foire aux questions

Qu'est-ce qu'Anthropic Computer Use et comment ça fonctionne ?

Anthropic Computer Use est une fonctionnalité qui permet à Claude AI de contrôler votre Mac en prenant des captures d'écran, en interprétant ce qui est à l'écran et en exécutant des clics de souris et des saisies clavier — exactement comme un humain le ferait. Il est disponible en aperçu de recherche pour les abonnés Claude Pro (17 $/mois) et Max (100 $-200 $/mois) sur macOS uniquement.

Claude Computer Use est-il sûr pour les applications sensibles ?

Claude nécessite une approbation de permission par application avant d'accéder à toute application, ce qui limite le rayon de dégâts des erreurs ou attaques. Cependant, le prompt injection reste une vulnérabilité démontrée, et Anthropic reconnaît que la fonctionnalité est encore précoce. Évitez d'accorder l'accès aux applications bancaires ou sensibles tant que le modèle de sécurité n'a pas mûri. Pour un regard plus approfondi sur la sécurité des agents IA, consultez les ressources d'évaluation de xCyberSecurity.

Comment Computer Use se compare-t-il à OpenClaw ?

Computer Use est plus facile à configurer (minutes vs. heures), Mac uniquement, verrouillé sur Claude et utilise un modèle de permissions par application plus sûr. OpenClaw est open-source, agnostique en termes de modèle, plus fiable pour l'automatisation répétitive, mais nécessite des connaissances Docker et CLI. Consultez la comparaison complète dans la section ci-dessus.

Anthropic Computer Use va-t-il remplacer des emplois humains ?

Le PDG d'Anthropic prédit que l'IA pourrait éliminer 50 % de tous les emplois de bureau de premier échelon en cinq ans. Computer Use cible spécifiquement la couche d'exécution routinière — planification, e-mail, compilation de recherches, remplissage de formulaires — plutôt que les rôles nécessitant une expertise approfondie. Les premières données de la recherche d'Anthropic de mars 2026 montrent que l'embauche des 22-25 ans a déjà ralenti dans les professions exposées à l'IA.

Computer Use fonctionne-t-il sous Windows ou Linux ?

Non. En mars 2026, Computer Use est disponible uniquement sur macOS. Le support Windows est prévu mais n'a pas de date de sortie publique. Le support Linux n'a pas été annoncé.

Travaillons ensemble

Vous cherchez à construire des systèmes d'IA, automatiser des workflows ou faire évoluer votre infrastructure technique ? Je serais ravi de vous aider.

Coffee cup

Vous avez apprécié cet article ?

Votre soutien m'aide à créer davantage de contenu technique approfondi, d'outils open source et de ressources gratuites pour la communauté des développeurs.

Sujets connexes

Engr Mejba Ahmed

À propos de l'auteur

Engr Mejba Ahmed

Engr. Mejba Ahmed builds AI-powered applications and secure cloud systems for businesses worldwide. With 10+ years shipping production software in Laravel, Python, and AWS, he's helped companies automate workflows, reduce infrastructure costs, and scale without security headaches. He writes about practical AI integration, cloud architecture, and developer productivity.

Discussion

Comments

0

No comments yet

Be the first to share your thoughts

Leave a Comment

Your email won't be published

9  x  8  =  ?

Continuer l'apprentissage

Articles connexes

Tout parcourir

Comments

Leave a Comment

Comments are moderated before appearing.

Learning Resources

Expand Your Knowledge

Accelerate your growth with structured courses, verified certificates, interactive flashcards, and production-ready AI agent skills.

Sample Certificate of Completion

Sample certificate — complete any course to earn yours

Engr Mejba Ahmed

Engr Mejba Ahmed

Claude Code Expert · Online

👋

Hey there!

Quick Actions

WhatsApp Instant reply

Chat on WhatsApp

+880 1723 741224 · Instant reply

Popular Questions

Engr Mejba Ahmed is connected
Engr Mejba Ahmed is typing...
Engr Mejba Ahmed avatar

✉ Want me to follow up? Drop your email

Engr Mejba Ahmed avatar

📞 Connect Directly

Choose how you'd like to reach me

WhatsApp

+880 1723 741224

Email

[email protected]

✓ Details sent! I'll get back to you shortly.

Powered by OpenAI

335+

Blog Posts

25

AI Courses

63

Projects

Services & Expertise

Pricing & Process

Learning & Resources

Connect & Support