Récapitulatif Google IO 2026 : Gemini Omni, Spark et le Virage Agent

Google IO 2026 en rétrospective : L'année où Google a arrêté de vendre des chatbots

J'ai regardé la keynote d'IO 2026 sur un deuxième écran avec un terminal ouvert sur le premier, m'attendant à moitié à ignorer l'essentiel.

Ce n'est pas de l'arrogance. C'est simplement ce que les deux dernières années de keynotes IA m'ont conditionné à attendre. Des démos de niveau marketing, un défilé de noms de modèles qui se confondent les uns avec les autres, un catalogue de fonctionnalités qui ne sortira que « plus tard dans l'année ». J'avais le volume bas. Je travaillais sur autre chose. Et puis, environ dix-huit minutes après le début, un ingénieur de DeepMind nommé Varun Mohan s'est levé et a dit nonchalamment que son équipe avait construit un système d'exploitation fonctionnel à partir de zéro en douze heures en utilisant Gemini 3.5 Flash et Antigravity — 93 sous-agents, 15 000 requêtes au modèle, 2,6 milliards de tokens traités, moins de 1 000 dollars de crédits API — puis il a chargé Doom dessus et a commencé à jouer.

J'ai coupé ma musique. J'ai fermé mon autre onglet. J'ai pris un carnet.

Ce moment m'a tout dit sur Google IO 2026 d'une manière que les diapositives ne pourraient jamais le faire. Google n'est pas venu à Mountain View le 19 mai 2026 pour vendre un autre chatbot. Ils sont venus pour vendre des agents — et pour ce faire, ils ont restructuré toute la grille tarifaire IA Ultra, lancé un tout nouveau modèle multimodal « any-to-any », présenté une application de bureau conçue entièrement autour de l'orchestration multi-agents, dévoilé une IA personnelle 24/7 qui vit sur une VM Google Cloud, et discrètement abaissé le plan premium de 250 à 200 dollars par mois pour pouvoir insérer un nouveau palier à 100 dollars en dessous.

Si tu es un builder, c'est la keynote la plus conséquente que Google ait jamais tenue depuis le lancement original de Gemini. J'ai passé les jours suivants à décortiquer chaque annonce, à recouper les affirmations techniques avec les rapports indépendants, et à déterminer quelles pièces je déploierais réellement cette semaine versus lesquelles sont du demo-ware. Voici le rapport de terrain — ce qui était réel, ce qui était du théâtre, et ce que je pense que cela signifie pour quiconque développe des logiciels avec l'IA en 2026.

Le changement de paradigme dont personne ne parle

Avant d'entrer dans les annonces spécifiques, il faut comprendre le cadrage car chaque révélation de produit en découle.

Au cours des trois dernières années, le centre de gravité de l'industrie de l'IA a été le chatbot. Tu tapes une question. Le modèle répond. Tu évalues la réponse. La tarification était structurée autour des prompts et des tokens. L'expérience utilisateur était structurée autour des messages. Les benchmarks étaient structurés autour de la qualité en tour unique.

Google IO 2026 a été le moment où ce paradigme s'est brisé publiquement.

Le changement de prix est le signal. L'application Gemini de Google passe des limites quotidiennes de prompts à un modèle de « compute utilisé », où une simple réponse textuelle ne consomme qu'une infime fraction de ton allocation mensuelle et un montage vidéo complexe ou une exécution d'agent de codage en consomme une beaucoup plus grande. Ce n'est pas un modèle de tarification de chatbot. C'est un modèle de tarification de charge de travail. Cela n'a de sens que si l'entreprise s'attend à ce que l'utilisateur moyen payant commence à exécuter des tâches qui ressemblent davantage à des jobs en arrière-plan qu'à des conversations.

Et chaque autre annonce le renforce. Gemini Spark est décrit comme « un agent IA 24/7 » qui vit en ton nom — pas un modèle à qui tu parles, mais un qui fonctionne pendant que tu dors. Antigravity 2.0 est décrit comme une application de bureau « agent-first » pour orchestrer du travail multi-agents en parallèle. La recherche reçoit « des agents autonomes alimentés par Gemini capables de surveiller des informations en continu et de prendre des actions au nom des utilisateurs. » Universal Cart est un agent de shopping, pas une recherche de shopping.

Tu m'entendras revenir à cette perspective régulièrement car c'est la seule qui donne du sens à la keynote. Une fois que tu la vois, chaque annonce s'emboîte. Alors laisse-moi parcourir ce qu'ils ont réellement livré — et ce que je testerais réellement.

Gemini Omni : Un modèle, toute modalité, un filigrane

La plus grande annonce de modèle de la journée n'était pas 3.5 Flash. C'était Gemini Omni, le nouveau modèle multimodal « any-to-any » de Google qui accepte n'importe quelle combinaison de texte, image, audio et vidéo en entrée et produit n'importe quelle combinaison en sortie.

Omni Flash — le premier modèle public construit sur le framework Omni — est celui que Google lance réellement. Selon les rapports, il peut générer de courts clips vidéo IA à partir de prompts textuels, animer des images fixes, éditer des scènes générées de manière conversationnelle, et répondre à des entrées combinées de texte, audio et image en temps réel. Il est décrit publiquement comme le prochain chapitre du travail qui a produit Nano Banana (le modèle d'édition/génération d'images de l'année dernière) et Genie (le modèle génératif de monde interactif de Google).

Ce qui m'a fait réagir dans cette annonce : Google ne l'a pas lancé discrètement en bêta. Ils l'ont lancé avec l'initiative de provenance de contenu la plus agressive que j'aie jamais vue de la part d'un grand laboratoire d'IA.

Chaque vidéo générée par Omni porte le filigrane numérique SynthID de Google. SynthID a désormais marqué plus de 100 milliards d'images et de vidéos générées par IA, et depuis IO 2026, NVIDIA, OpenAI, ElevenLabs et Kakao adoptent le standard. Les Content Credentials C2PA sont étendus aux outils génératifs de Google, et il y a maintenant une API de Détection de Contenu IA sur Google Agent Platform qui permet aux entreprises d'identifier le contenu généré par IA des modèles de Google et d'autres modèles populaires.

Relis ce paragraphe. OpenAI adopte le standard de filigrane de Google. Cela seul constitue l'histoire d'alignement industriel la plus significative depuis le lancement de l'API GPT originale, et cela a à peine été mentionné dans la couverture résumée parce que ce n'est pas une démo flashy. C'est un aveu de toute l'industrie des modèles de frontière qu'un internet de médias synthétiques non marqués est impraticable, et ils cèdent collectivement du terrain à un standard technique partagé pour devancer les régulateurs.

Si tu construis quoi que ce soit qui consomme du contenu généré par les utilisateurs — modération, plateformes publicitaires, outils de journalisme, réseaux sociaux, surveillance de marque — c'est l'annonce la plus importante orientée développeurs de toute la keynote. Le stack C2PA + SynthID est maintenant suffisamment large pour que « est-ce généré par l'IA ? » devienne un signal réel et interrogeable dans ton pipeline de données. J'ai couvert la crise des données d'entraînement IA plus tôt cette année et la question ouverte que j'avais laissée non résolue était la provenance. Le lancement d'Omni est la première fois que je vois une réponse crédible.

Ce que je testerais cette semaine : fais passer un lot de médias soumis par les utilisateurs dans l'API de Détection de Contenu IA et regarde à quoi ressemblent réellement les taux de faux positifs et de faux négatifs en conditions réelles. Ne fais pas confiance aux chiffres de la démo. Teste-le sur tes données.

Gemini 3.5 Flash : Le modèle conçu pour les agents

Gemini 3.5 Flash est le modèle qui a produit le moment Doom-sur-un-nouveau-SO, et l'histoire technique derrière est plus intéressante que la démo.

Selon les propres affirmations de Google et les rapports indépendants, Gemini 3.5 Flash :

Surpasse Gemini 3.1 Pro sur presque tous les benchmarks tout en fonctionnant environ quatre fois plus vite que les autres modèles de frontière en tokens de sortie par seconde
Obtient 76,2% sur Terminal-bench 2.1 (évaluation de codage)
Obtient 1656 sur GDPval-AA (benchmark agentique du monde réel)
Est co-optimisé avec le harness Antigravity — ce qui signifie que le modèle et le runtime multi-agents ont été entraînés et ajustés ensemble, pas assemblés au moment du lancement

Le dernier point est celui que la plupart des couvertures ont manqué. Quand tu entraînes un modèle de frontière à être bon en travail agentique, et que tu entraînes simultanément le harness dans lequel il fonctionne pour présenter les bons appels d'outils et fenêtres de contexte aux bons moments, tu obtiens un comportement qui n'est pas reproductible en insérant simplement un modèle différent. C'est la même insight architecturale qu'Anthropic poursuit avec Claude Code — le modèle et le runtime ne sont pas des produits indépendants — et c'est une grande partie de la raison pour laquelle j'ai utilisé Claude Code comme outil quotidien l'année dernière. Google s'est maintenant publiquement engagé dans la même philosophie.

L'affirmation de vitesse de sortie 4x mérite son propre moment. Si Gemini 3.5 Flash délivre réellement quatre fois les tokens par seconde des autres modèles de frontière à qualité comparable, les mathématiques pour les workflows agentiques changent complètement. Un agent multi-étapes faisant 15-20 appels d'outils par tâche n'est pas limité par la qualité de raisonnement au-delà d'un certain point — il est limité par la latence. Réduis la latence de manière significative et l'agent peut récupérer des erreurs, replanifier et ré-exécuter dans le même budget de temps réel qui ne contenait auparavant que la première tentative. C'est un plafond différent.

Mais voici où je vais être honnête sur les limites du reportage du premier jour. Les scores Terminal-bench 2.1 et GDPval-AA semblent solides sur le papier, mais je n'ai pas encore fait passer 3.5 Flash dans mon harness de codage personnel. Quand j'ai testé Gemini 3 Deepthink plus tôt cette année, les benchmarks publiés ont raisonnablement tenu, mais les modes de défaillance n'étaient pas visibles jusqu'à ce que je lui lance de vrais problèmes de codebase. Traite donc les chiffres principaux comme directionnels, pas comme parole d'évangile. J'aurai une review complète séparée après avoir exécuté mes propres évaluations.

Ce que je testerais cette semaine : prends un workflow agentique réel que tu exécutes actuellement sur Claude ou GPT et ré-exécute-le sur Gemini 3.5 Flash via le harness Antigravity. Fais particulièrement attention au comportement de récupération sur les échecs d'appels d'outils, pas seulement au succès du premier essai. C'est là que la co-optimisation se manifeste habituellement.

Antigravity 2.0 : La plateforme d'agents autonome

J'ai écrit sur l'Anti-Gravity IDE original il y a quelques mois et j'ai décrit comment j'ai livré une app financière full-stack dedans en 47 minutes. Ce produit était un IDE — un éditeur enveloppé autour d'agents IA.

Antigravity 2.0, annoncé à IO 2026, est quelque chose de différent. C'est une application de bureau autonome conçue entièrement autour d'une expérience optimisée pour les agents. Selon les points forts pour développeurs de Google, elle est livrée avec une CLI, un SDK, une exécution gérée et un support entreprise. Les développeurs peuvent orchestrer plusieurs agents en parallèle et exécuter des tâches sur des workflows de long horizon.

Le changement structurel de 1.x à 2.0 est la partie qui compte. L'Anti-Gravity original a mis des agents dans un éditeur. La nouvelle version inverse la relation — la plateforme d'agents est la surface primaire, et l'éditeur n'est qu'un des outils qu'un agent peut utiliser. C'est une philosophie de design significativement différente.

La démo Doom-sur-un-nouveau-SO était le point de preuve. 93 sous-agents travaillant en parallèle, 15 000 requêtes au modèle, 2,6 milliards de tokens, 12 heures de temps réel, moins de 1 000 dollars de dépenses API. Si tu as déjà essayé d'orchestrer autant d'agents concurrents manuellement, tu connais les modes de défaillance — agents qui se marchent dessus sur les changements du système de fichiers, appels d'outils bloqués, fenêtres de contexte qui explosent par crosstalk. Le fait que Google l'ait démontré sans chaos visible suggère que la couche d'orchestration fait un vrai travail, pas juste lancer des sous-processus et espérer.

La CLI et le SDK comptent encore plus que l'app de bureau pour les builders sérieux. Une CLI est ce que tu branches dans le CI. Une CLI est ce que tu scriptes. Une CLI est ce que tu exécutes sur un serveur la nuit. Une app de bureau est ce que tu montres aux dirigeants. Qu'Antigravity 2.0 ait les deux signifie que Google est sérieux quant à maintenir la plateforme comme infrastructure de production, pas seulement comme démo de la semaine de lancement.

J'ai passé l'année dernière à construire la majeure partie de mon travail agentique dans Claude Code et à le router à travers l'Agent SDK d'Anthropic. Antigravity 2.0 est la première plateforme concurrente que j'ai vue qui semble structurellement prête à héberger de vraies charges de travail de production — pas parce que le marketing le dit, mais parce que la forme du produit (CLI + SDK + exécution gérée + support entreprise) est la forme que tu construis quand tu t'attends à ce que d'autres personnes exécutent ta plateforme en production.

Ce que je testerais cette semaine : exécute la même tâche d'agent dans Antigravity 2.0 et Claude Code côte à côte. Ne mesure pas seulement la qualité — mesure la récupération de pannes, l'observabilité, et à quoi ressemble la trace quand un agent déraille. C'est là que vit la préparation à la production.

Gemini Spark : Le pari à 100 dollars sur les agents personnels

Voici l'annonce qui a déclenché le débat le plus animé dans mes chats de groupe. Gemini Spark.

Spark est, selon les propres mots de Google, un agent IA 24/7 qui vit sur des VMs Google Cloud et fonctionne en continu en ton nom. Il s'intègre avec MCP (Model Context Protocol — le standard créé par Anthropic qui est discrètement devenu le standard de l'industrie pour les appels d'outils). Il aura une intégration Chrome cet été. Et c'est la fonctionnalité phare derrière une restructuration majeure du palier tarifaire IA Ultra.

Les mathématiques du prix :

Le plan Ultra premium précédent était à 250 dollars par mois. Ce palier existe toujours mais coûte maintenant 200 dollars par mois, avec des limites d'utilisation plus élevées et plus de stockage.
Un nouveau palier Ultra à 100 dollars par mois a été introduit en dessous. Le plan à 100 dollars inclut des limites d'utilisation 5 fois plus élevées dans l'app Gemini par rapport au palier AI Pro à 20 dollars, 20 téraoctets de stockage cloud, YouTube Premium, et un accès bêta à Gemini Spark pour les abonnés américains.
Spark lui-même est déployé auprès de testeurs de confiance la semaine suivant la keynote, et aux abonnés Google AI Ultra aux États-Unis la semaine d'après en bêta.

Mets les changements de prix de côté un instant. La question intéressante est ce qu'est Spark réellement au niveau architectural — parce que si c'est ce que Google implique, c'est une catégorie de produit différente de tout ce que ChatGPT ou Claude proposent actuellement.

La plupart des « agents IA » actuels fonctionnent en réponse à un prompt de l'utilisateur. Tu demandes, il agit, il retourne. La session est délimitée par la conversation. Même les projets de Claude et les GPTs de ChatGPT sont fondamentalement du request-response — ils maintiennent le contexte entre les sessions, mais ils ne fonctionnent pas quand tu ne regardes pas.

Spark fonctionne sur une VM. Il a une existence continue. Il peut surveiller des choses, prendre des actions et te faire un rapport basé sur son propre planning — pas parce que tu as ouvert l'app, mais parce que le monde a changé et il l'a remarqué.

Si c'est vraiment comme ça que ça fonctionne, le potentiel est considérable. Les cas d'usage sont évidents — suivi des prix de vols, alertes de réapprovisionnement, garde du calendrier, triage d'emails, surveillance d'un tableau de projet, surveillance de la page de prix d'un concurrent — mais ils sont évidents de la même manière que « avoir un téléphone dans sa poche » était évident en 2007. Le fait que tu puisses les lister ne signifie pas que nous savons comment le produit remodèle le comportement quotidien.

Voici où je suis sceptique. Le prix d'entrée de 100 dollars place fermement Spark dans le palier « power user » — c'est 5 fois le prix d'AI Pro et bien au-dessus de ce que la plupart des SaaS grand public coûtent. Pour un produit qui doit démontrer sa valeur à travers de nombreuses tâches ambiantes, facturer 100 dollars par mois avant que quiconque sache si ça marche est audacieux. La baisse de 250 à 200 dollars sur le palier supérieur adoucit le coup (et signale une pression concurrentielle réelle des plans Pro d'Anthropic et OpenAI), mais Spark lui-même est bloqué derrière un prix que la plupart des gens ne paieront pas tant que le cas ne sera pas écrasant de clarté.

Je testerai Spark la semaine où il atterrira dans la bêta américaine. La question spécifique que j'apporte est de savoir si le cadrage 24/7 est un vrai comportement produit ou du langage marketing pour « nous avons gardé la fenêtre de contexte entre les sessions. » Il y a une différence. Le premier est une nouvelle catégorie. Le second est un chatbot avec une meilleure mémoire.

Si tu as suivi la guerre des prix au sens large, tu reconnaîtras cela comme la même dynamique que j'ai couverte dans mon article sur la commoditisation des abonnements IA — la couche applicative est là où se trouve l'argent, et les laboratoires de modèles courent pour la capturer avant que la couche applicative ne les capture. Spark est le mouvement le plus explicite de Google dans cette course.

Docs Live, Ask Maps, Ask YouTube : Le pivot Workspace

Les annonces de surface grand public ont eu moins de temps sur scène mais ce sont celles qui atteindront le plus de personnes. Trois comptent le plus.

Docs Live est l'édition de Google Docs pilotée par la voix — tu peux dire à Docs de déplacer des sections, de formater du texte en gras ou en italique, et de restructurer des documents par commandes vocales. Il est déployé pour Android et iOS cet été avec Google AI Pro et Ultra en anglais dans le monde entier. Le cadrage dans la keynote a mis l'accent sur l'accessibilité — et le cas d'usage pour les utilisateurs ayant des déficiences motrices ou visuelles est véritablement significatif — mais le bénéfice plus large est que l'édition vocale est enfin suffisamment précise pour être une vraie surface de productivité, pas un gadget. Apple essaie de livrer cela depuis une décennie. Google le livre parce que le modèle sous-jacent de speech-to-intent a enfin franchi le seuil de qualité.

Ask Maps transforme Google Maps en une surface de recherche conversationnelle. Tu peux poser des questions sur les lieux comme tu le ferais à un local — pas seulement « trouve-moi du café près d'ici » mais « trouve-moi un café calme avec un WiFi fiable et des places en terrasse où je peux prendre un appel vidéo. » Le même principe que la recherche ChatGPT, mais avec les données cartographiques de Google en dessous, ce qui constitue un avantage concurrentiel significatif.

Ask YouTube te permet d'interroger du contenu vidéo de manière conversationnelle. Le cas d'usage phare ici n'est pas de regarder des vidéos différemment — c'est la recherche. Je fais cela manuellement depuis des années avec un pipeline personnalisé qui extrait les transcriptions et les fait passer dans Claude. Ask YouTube le fait nativement. L'implication pour les créateurs de contenu est significative : la découvrabilité passe maintenant par la requête conversationnelle, pas seulement par les mots-clés de la barre de recherche, ce qui signifie que la façon dont tu structures ton contenu vidéo (chapitres, transcriptions, explications à l'écran) affecte directement si l'IA le fait remonter.

Ces trois fonctionnalités reposent sur un fait architectural : l'avantage de données d'entraînement de Google sur les cartes, la vidéo et la collaboration documentaire est énorme, et l'IA conversationnelle est enfin la bonne interface pour monétiser cet avantage à grande échelle. J'ai couvert le framework de Google pour la transformation agentique de l'IA en février, et le fil conducteur de cet article jusqu'à IO 2026 est le même — l'avantage de Google n'est pas la qualité du modèle, c'est le graphe de données sur lequel le modèle est posé.

Recherche Intelligente, Universal Cart et l'agent dans les résultats de recherche

C'est le lot d'annonces qui va réellement remodeler le SEO et le e-commerce, et il mérite beaucoup plus d'attention qu'il n'en reçoit.

Google Search est en cours de refonte autour d'une boîte de recherche multimodale (texte, image, vidéo, voix), d'agents de recherche IA 24/7 qui surveillent des sujets et te notifient des changements, et — la partie qui m'a véritablement surpris — du codage agentique dans les résultats de recherche qui peut générer des UI et widgets dynamiques à la demande. C'est exact. La page de résultats de recherche elle-même devient un runtime qui peut générer de petites applications interactives basées sur ta requête.

Si tu cherchais « compare ces trois chaussures de running par drop du médio-pied » aujourd'hui, tu obtiendrais des articles. Dans la nouvelle Search, tu obtiendrais un widget de comparaison qui récupérerait des données en temps réel et se rendrait sous forme de petit tableau interactif dans les résultats. Généré par un agent. Au moment de la requête.

Cela sera disponible mondialement et gratuitement à partir de l'été 2026. Ce calendrier compte parce qu'il signifie que le paysage SEO change en mois, pas en années. J'ai écrit sur ce changement par bribes — optimisation pour moteurs génératifs, citabilité au niveau du passage, la mort du listicle — et IO 2026 est le moment où cela devient concret. La page de résultats n'est plus une liste de liens. C'est un runtime d'agents.

Universal Cart est le compagnon e-commerce. Un panier d'achat alimenté par Gemini qui opère simultanément sur Search, YouTube et Gmail. Il trouve des offres, suit l'historique des prix, alerte sur les réapprovisionnements, et — la partie véritablement utile — signale les combinaisons de produits incompatibles. Essaie d'ajouter une carte mère et un processeur qui ne partagent pas le même socket et Universal Cart le remarque.

Le déploiement aux États-Unis est pour l'été 2026. Si tu vends quoi que ce soit en ligne, l'implication est la même que pour les éditeurs de contenu : ta surface de produit n'est plus un site web que les gens visitent. C'est un flux de données structurées qu'un agent lit au nom de l'utilisateur. Schema, données produit structurées, inventaire en temps réel et transparence des prix deviennent soudainement les éléments qui déterminent si un agent te recommande. L'optimisation de conversion cesse d'être une question de landing page et devient une question de couche de données.

J'ai couvert une version de cette thèse dans mon article sur les agents IA qui remodèlent le travail, mais Universal Cart la rend concrète dans le retail. Si tu gères une boutique e-commerce et que tu n'as pas de données produit structurées propres d'ici le Q3 2026, tu seras invisible pour une part significative de l'intention d'achat.

Audio Glasses, refonte de l'app Gemini et la couche Workspace

Google a gardé la révélation hardware pour la fin de la keynote, ce qui en dit long sur leur confiance dans la capacité du logiciel à tirer la demande. L'annonce des lunettes intelligentes est réelle mais modeste : des lunettes audio avec haut-parleurs et caméras intégrés, fabriquées par Samsung et Qualcomm, avec des designs de Gentle Monster et Warby Parker, lancement automne 2026, fonctionnant sur Android et iOS.

Ce ne sont pas les Ray-Bans de Meta avec écran. C'est un accès Gemini voice-first et mains-libres, avec des caméras qui peuvent capturer et transmettre du contexte à l'assistant. Les démos ont montré Gemini navigant vers des lieux que l'utilisateur avait visités auparavant et commandant des articles via des apps intégrées tout en se souvenant des préférences de l'utilisateur. L'intégration au poignet avec la Pixel Watch est incluse.

Je ne suis pas quelqu'un à lunettes et je suis sceptique quant au fait que des lunettes IA uniquement audio deviennent un produit de masse. Mais la logique stratégique est correcte — Google a besoin d'une surface hardware ambiante pour Gemini avant qu'Apple ne lance quelque chose de compétitif, et la structure de partenariat (Samsung + Qualcomm + marques de mode) est la manière de transformer un produit tech en quelque chose que des gens normaux porteront réellement. L'automne 2026 est le moment où nous saurons si le marché grand public répond réellement.

L'app Gemini elle-même reçoit une refonte — Google appelle le nouveau langage de design « Neural Expressive » — et un nouvel outil Google Pix pour l'édition d'images dans Workspace. Flow Music est lancé comme surface de génération audio. Aucune d'entre elles n'est individuellement déterminante, mais collectivement elles disent quelque chose sur l'engagement de Google à faire de Gemini la surface d'utilisation quotidienne à travers les produits grand public, pas seulement une API. J'ai suivi une partie de ce fil dans mon article sur l'intégration NotebookLM et app Gemini, et le schéma continue — Google traite Gemini comme la couche opérationnelle de tout ce qu'ils lancent, pas comme une fonctionnalité dans un seul produit.

Code Mender, expansion de SynthID et l'histoire silencieuse de la sécurité

Je veux consacrer un paragraphe aux annonces de sécurité car elles ont été enterrées sous les révélations grand public et elles ne devraient pas l'être.

Code Mender est la partie qui compte le plus pour les builders. C'est un agent IA de DeepMind qui détecte, corrige et réécrit automatiquement le code vulnérable. Il utilise un débogueur, un navigateur de code source, du fuzzing et des prouveurs de théorèmes pour trouver les causes racines, puis génère et valide de manière autonome des patches contre les régressions et les directives de style avant de les présenter pour revue humaine. Dans les six mois précédant l'annonce d'IO, l'équipe de Code Mender a contribué 72 correctifs de sécurité à des projets open source, y compris des bases de code allant jusqu'à 4,5 millions de lignes.

Relis ce chiffre. 72 vrais patches de sécurité, sur du vrai open source, validés par des humains, acceptés en upstream. Ce n'est pas un benchmark. C'est un agent déployé qui fait de l'ingénierie de sécurité à l'échelle de la production.

Les API de code pour Code Mender sont en aperçu testeur depuis IO. Si tu maintiens une base de code significative — open source ou propriétaire — c'est l'annonce que je surveillerais le plus attentivement au cours du prochain trimestre. L'économie d'avoir un agent de sécurité fonctionnant en continu attaché à ton dépôt est très différente d'exécuter un audit tiers périodique. J'ai écrit sur cette transition de catégorie dans mon article sur le débat de la découverte de zero-days par IA, et Code Mender est l'exemple de production le plus concret que j'aie vu.

L'expansion de SynthID est l'autre moitié de l'histoire de la sécurité. Le standard de filigrane couvre maintenant NVIDIA, OpenAI, ElevenLabs et Kakao, avec plus de 100 milliards d'images et de vidéos marquées. Les Content Credentials C2PA sont étendus aux outils génératifs de Google. L'API de Détection de Contenu IA est maintenant disponible sur Agent Platform. Ce ne sont pas des annonces glamour. Ce sont des mouvements de standardisation lents, au niveau de l'infrastructure. Ce sont aussi exactement ce qu'une industrie en maturation produit quand les régulateurs commencent à se montrer aux auditions.

Gemini pour la Science : Le pari à long terme

Google a gardé les annonces les plus ambitieuses pour les parties de la keynote qui n'affecteront directement la feuille de route trimestrielle de personne. Gemini for Science comprend deux éléments qui méritent d'être notés.

AlphaEarth Foundations est maintenant positionné publiquement comme un jumeau numérique de la Terre — un satellite virtuel qui ingère des images optiques, du radar, du LiDAR et des données climatiques et compresse toute la surface terrestre en un embedding interrogeable à une résolution de cellule de 10x10 mètres, mis à jour annuellement. Le modèle réduit les besoins de stockage d'un facteur 16 par rapport aux autres systèmes IA testés par Google. Ils travaillent avec plus de 50 organisations sur des applications du monde réel — sécurité alimentaire, déforestation, planification urbaine, ressources en eau. Coupler AlphaEarth avec les capacités de raisonnement de Gemini est la prochaine étape, ce qui permettrait aux analystes de poser des questions en langage naturel comme « où en Amazonie l'empiétement des cultures s'est-il accéléré au cours des trois dernières années » et d'obtenir une réponse fondée sur les données.

Isomorphic Labs — la société de découverte de médicaments d'Alphabet construite sur les fondations d'AlphaFold — est en bonne voie pour mettre ses premiers médicaments conçus par IA en essais cliniques d'ici la fin 2026. Ils ont levé 2,1 milliards de dollars en financement Série B plus tôt ce mois-ci pour accélérer l'Isomorphic AI Drug Design Engine.

Aucun de ces éléments ne sera disponible dans un SDK pour développeurs dans les six prochains mois. Mais le schéma — l'IA de frontière appliquée à de grands graphes de données du monde physique (Terre, biologie) — est le pari à long terme qui justifie tout l'investissement en calcul qu'Alphabet fait depuis 2023. La majeure partie de ce que Google a annoncé à IO 2026 concerne la capture de la couche applicative. AlphaEarth et Isomorphic justifient l'investissement en infrastructure sous-jacente sur un horizon d'une décennie.

Ce que je fais réellement cette semaine

Laisse-moi terminer avec la perspective du praticien, car c'est pour cela que la plupart d'entre vous sont venus.

De tout ce que Google a livré à IO 2026, voici ce que je testerais réellement dans les sept prochains jours, classé par ce que je pense affectera ton travail quotidien :

Fais passer Gemini 3.5 Flash dans ton vrai workflow agentique. Pas un benchmark jouet. Prends n'importe quelle tâche d'agent multi-étapes que tu exécutes actuellement sur Claude ou GPT, porte-la sur Gemini 3.5 Flash via le harness Antigravity, et mesure la latence, le comportement de récupération, et le coût total par tâche complétée. L'affirmation de vitesse 4x est le chiffre le plus testable de la keynote. Teste-le.

Installe Antigravity 2.0 et essaie l'orchestration d'agents en parallèle. Si tu exécutes des chaînes d'agents séquentielles, le modèle parallèle est un pattern de design significativement différent. Construis quelque chose de petit — une tâche de recherche avec trois sous-agents concurrents (collecter, synthétiser, formater) — et vois comment l'outillage de trace tient quand l'un d'eux échoue.

Branche la détection SynthID/C2PA dans ton pipeline de contenu. Si tu livres quoi que ce soit qui ingère des médias uploadés par les utilisateurs, l'API de Détection de Contenu IA sur Agent Platform est l'annonce d'infrastructure la plus importante de toute la keynote. Ce n'est pas glamour. C'est aussi une fonctionnalité dont tes utilisateurs et ton équipe juridique se soucieront dans un an. J'ai couvert le problème de provenance du contenu tangentiellement avant — voici la réponse.

Ne paie pas pour Gemini Spark avant d'avoir vu de vraies données d'utilisation. Je le testerai la semaine où il atterrira dans la bêta américaine. Le prix d'entrée de 100 dollars est un pari sur une catégorie de produit qui n'a pas encore de base installée. Observe les revues indépendantes. Attends deux semaines. Puis décide.

Audite tes données structurées de produit/contenu avant qu'Universal Cart et la Recherche Intelligente ne se déploient mondialement. L'été 2026 est plus proche qu'il n'y paraît. Si tu vends quoi que ce soit en ligne ou publies quoi que ce soit qui dépend du trafic de recherche, la couche d'agents lit tes données structurées, pas ton texte marketing. Assure-toi qu'elles sont propres.

Passe les lunettes pour l'instant. Les lunettes intelligentes uniquement audio vont être un produit de niche pour la première génération. L'automne 2026 est le moment où la catégorie devient réelle — c'est le cycle à évaluer, pas le lancement.

De quoi la keynote parlait vraiment

L'unique insight que je retiendrais de Google IO 2026 — celui auquel je réfléchirai pendant le prochain trimestre — est que la structure tarifaire raconte toute l'histoire.

Quand une entreprise passe d'une tarification basée sur les prompts à une tarification basée sur le compute, elle te dit qu'elle s'attend à ce que son utilisateur moyen commence à exécuter des charges de travail, pas des conversations. Quand elle abaisse le palier supérieur de 250 à 200 dollars et introduit un nouveau palier en dessous à 100 dollars, elle te dit que le plafond de prix précédent était trop élevé pour recruter la prochaine vague d'utilisateurs dont elle a besoin. Quand elle livre un agent personnel 24/7 en même temps qu'une application de bureau construite autour de l'orchestration multi-agents, elle te dit que les deux prochaines années de compétition se dérouleront sur la couche d'agents, pas sur la couche de modèles.

Google n'a pas livré un chatbot plus intelligent à IO 2026. Ils ont livré l'infrastructure pour un monde où les chatbots ne sont plus le produit principal. Le modèle est rapide et bon marché. Le harness est conçu pour le parallélisme. La tarification suppose du travail en arrière-plan. Le hardware est ambiant. La couche de détection suppose que les médias synthétiques sont partout.

C'est le pivot. Et que tu livres quoi que ce soit avec le stack de Google ou non, le reste de l'industrie va les suivre dans la même direction. Anthropic y est déjà. OpenAI est en mouvement. La couche applicative est là où la prochaine année de compétition IA sera décidée, et Google vient de déclarer qu'ils ne la perdront pas sans se battre.

J'écrirai une analyse approfondie d'Antigravity 2.0 une fois que j'aurai livré un vrai projet à travers. En attendant, la question que je te laisserais est celle-ci : quand tu regardes ton workflow IA actuel — tes prompts, tes abonnements, tes outils — quelle part suppose encore que le chatbot est le produit ? Si la réponse est « la majeure partie », tu as six mois pour reconstruire avant que le reste de l'industrie ne rattrape la perspective de Google.

L'ère des agents n'a pas commencé le 19 mai 2026. Mais c'est la date à laquelle la plus grande entreprise de logiciels a cessé de prétendre le contraire.

Questions fréquemment posées

Qu'est-ce que Gemini Omni ?

Gemini Omni est le nouveau modèle multimodal any-to-any de Google qui accepte n'importe quelle combinaison de texte, image, audio et vidéo en entrée et produit n'importe quelle combinaison en sortie. Omni Flash est le premier modèle public sur le framework. Chaque vidéo générée par Omni porte le filigrane SynthID de Google. Pour le détail complet, voir la section Gemini Omni ci-dessus.

Quelle est la vitesse de Gemini 3.5 Flash par rapport aux autres modèles de frontière ?

Gemini 3.5 Flash fonctionne environ quatre fois plus vite que les autres modèles de frontière en tokens de sortie par seconde tout en surpassant Gemini 3.1 Pro sur presque tous les benchmarks. Il a obtenu 76,2% sur Terminal-bench 2.1 et 1656 sur GDPval-AA, et a été co-optimisé avec le harness Antigravity pour les workflows agentiques.

Combien coûte le nouveau plan Google AI Ultra ?

Le nouveau plan Google AI Ultra commence à 100 dollars par mois, remplaçant l'ancien palier supérieur de 250 dollars par un palier de 200 dollars au-dessus. Le plan de 100 dollars inclut des limites d'utilisation 5 fois plus élevées qu'AI Pro, 20 téraoctets de stockage cloud, YouTube Premium, et un accès bêta à Gemini Spark pour les abonnés américains.

Qu'est-ce que Gemini Spark ?

Gemini Spark est un agent IA 24/7 qui fonctionne sur des VMs Google Cloud au nom d'un utilisateur, s'intègre avec MCP (Model Context Protocol), et recevra une intégration Chrome à l'été 2026. Il est déployé en bêta pour les abonnés Google AI Ultra aux États-Unis à partir de la semaine suivant IO 2026.

Quand les fonctionnalités de Google IO 2026 sont-elles lancées ?

La plupart des annonces grand public sont lancées à l'été 2026 (Docs Live, Universal Cart, Recherche Intelligente à l'échelle mondiale, intégration Chrome pour Spark). Les lunettes audio intelligentes de Samsung et Qualcomm sont lancées à l'automne 2026. Antigravity 2.0 et Gemini 3.5 Flash sont disponibles immédiatement pour les développeurs.

Travaillons ensemble

Tu cherches à construire des systèmes IA, automatiser des workflows ou faire évoluer ton infrastructure technique ? Je serais ravi d'aider.

Fiverr (builds et intégrations personnalisés) : fiverr.com/s/EgxYmWD
Portfolio : mejba.me
Ramlit Limited (solutions entreprise) : ramlit.com
ColorPark (design et branding) : colorpark.io
xCyberSecurity (services de sécurité) : xcybersecurity.io

Récapitulatif Google IO 2026 : Gemini Omni, Spark et le Virage Agent

Google IO 2026 en rétrospective : L'année où Google a arrêté de vendre des chatbots

Le changement de paradigme dont personne ne parle

Gemini Omni : Un modèle, toute modalité, un filigrane

Gemini 3.5 Flash : Le modèle conçu pour les agents

Antigravity 2.0 : La plateforme d'agents autonome

Gemini Spark : Le pari à 100 dollars sur les agents personnels

Docs Live, Ask Maps, Ask YouTube : Le pivot Workspace

Recherche Intelligente, Universal Cart et l'agent dans les résultats de recherche

Audio Glasses, refonte de l'app Gemini et la couche Workspace

Code Mender, expansion de SynthID et l'histoire silencieuse de la sécurité

Gemini pour la Science : Le pari à long terme

Ce que je fais réellement cette semaine

De quoi la keynote parlait vraiment

Questions fréquemment posées

Qu'est-ce que Gemini Omni ?

Quelle est la vitesse de Gemini 3.5 Flash par rapport aux autres modèles de frontière ?

Combien coûte le nouveau plan Google AI Ultra ?

Qu'est-ce que Gemini Spark ?

Quand les fonctionnalités de Google IO 2026 sont-elles lancées ?

Travaillons ensemble

Vous avez apprécié cet article ?

Sujets connexes

Engr Mejba Ahmed

Comments

Leave a Comment

Articles connexes

AI cette semaine : GLM-5.2, Fable 5, Diffusion Gemma

Tour d'horizon IA 14 mai 2026 : Six jours avant Google I/O

Le piège des licenciements IA : pourquoi licencier détruit la demande

Comments

Leave a Comment

Expand Your Knowledge

AI School

Certificates

Learning Flashcards

AI Agent Skills

Prêt à transformer

vos idées ?

Engr Mejba Ahmed

Hey there!