Notion de la semaine : Dreaming (mémoire d'agent) : processus programmé qui examine les sessions passées d'un agent IA, extrait les patterns récurrents et met à jour sa mémoire pour améliorer ses performances futures, par analogie avec le sommeil humain.

Voici les 8 grandes annonces à retenir :

 

Anthropic offre à ses agents Claude la capacité de rêver pour s'auto-améliorer

À l'occasion de la conférence développeurs Code with Claude le 6 mai à San Francisco, Anthropic a dévoilé trois nouvelles capacités majeures pour ses Managed Agents : Dreaming (en preview recherche), Outcomes (évaluation par résultat plutôt que par étapes) et l'orchestration multi-agents en bêta publique. Le Dreaming est la nouveauté la plus remarquée : un processus de fond qui examine les sessions passées d'un agent pour identifier ses erreurs récurrentes et ses contournements efficaces, puis met à jour sa mémoire en conséquence. Le cabinet juridique Harvey a constaté une multiplication par six des taux de complétion des tâches en l'activant en interne avant le lancement. Pour les entreprises déployant des agents IA en production, c'est une réponse directe au problème opérationnel le plus persistant : les agents qui répètent indéfiniment les mêmes erreurs sur des cas pourtant déjà rencontrés. 

Mistral lance Medium 3.5 et industrialise ses agents de code dans le cloud

Mistral AI a dévoilé le 2 mai Mistral Medium 3.5, modèle dense de 128 milliards de paramètres en preview publique, et la version cloud de Vibe, son agent de coding (auparavant cantonné au terminal local). Le modèle atteint 77,6% sur SWE-Bench Verified (référence pour la résolution de tickets logiciels réels) et s'affirme comme le nouveau modèle par défaut dans Le Chat. Les agents Vibe Remote tournent désormais en sandbox isolée dans le cloud avec téléportation des sessions locales, intégrations natives à GitHub, Linear, Jira, Sentry, Slack et Teams, et ouvrent automatiquement des pull requests une fois le travail terminé. Pour les DSI européens et les équipes en industries régulées (finance, santé, juridique), l'argument est double : performance frontière en open-weight, et déploiement possible sur infrastructure souveraine via Mistral Studio. 

Google transforme Android en système d'intelligence proactive avec Gemini Intelligence

Lors du Android Show I/O Edition diffusé le 12 mai, Google a annoncé Gemini Intelligence, couche d'intelligence intégrée nativement à Android sur les terminaux Samsung Galaxy et Google Pixel les plus récents, avec extension prévue aux montres, voitures, lunettes et ordinateurs portables. La capacité d'agir entre applications change la nature même du système d'exploitation : Gemini peut désormais consulter Gmail, construire un panier sur Instacart, réserver un restaurant et revenir vers l'utilisateur avant validation finale. Le directeur Android Sameer Samat a résumé le glissement par une formule (passage d'un système d'exploitation à un système d'intelligence). Pour les marques et les éditeurs d'applications, l'enjeu stratégique est majeur : la couche d'interaction se déplace de l'app vers l'agent, ce qui rebat les cartes de la découvrabilité, de la fidélisation et du paiement mobiles. 

OpenAI bascule ChatGPT sur GPT-5.5 Instant et réduit drastiquement les hallucinations

OpenAI a déployé le 5 mai GPT-5.5 Instant comme nouveau modèle par défaut de ChatGPT, remplaçant GPT-5.3 Instant pour les centaines de millions d'utilisateurs quotidiens. Selon les évaluations internes, le modèle produit 52,5% d'affirmations hallucinées en moins sur les sujets sensibles (médecine, droit, finance) tout en conservant la faible latence de son prédécesseur. Sa principale nouveauté pour les usages professionnels tient à la gestion de contexte enrichie : GPT-5.5 Instant peut désormais s'appuyer sur les conversations passées, les fichiers stockés et un compte Gmail connecté pour produire des réponses personnalisées, avec affichage explicite des sources mémoire utilisées et possibilité pour l'utilisateur de les supprimer ou corriger. Cette transparence sur la personnalisation algorithmique anticipe les exigences réglementaires européennes à venir et constitue un argument commercial fort pour les déploiements en entreprise. 

Google, Microsoft et xAI accepteront un audit gouvernemental de leurs modèles avant publication

Le NIST a annoncé le 5 mai que Google, Microsoft et xAI partageront les versions non publiées de leurs modèles d'IA avec le Center for AI Standards and Innovation (CAISI), rattaché au Département du Commerce américain, pour évaluation préalable des risques pour la sécurité nationale et la cybersécurité. Cette inflexion fait suite à la révélation par Anthropic de Project Glasswing le mois précédent (modèle Claude Mythos jugé trop puissant pour publication ouverte) et marque une rupture avec l'approche jusqu'ici très libérale de l'administration Trump sur l'IA. OpenAI a ouvert en parallèle ses modèles les plus avancés à l'ensemble des niveaux habilités du gouvernement fédéral. Pour les entreprises clientes, ces accords volontaires anticipent une vraisemblable institutionnalisation des tests pré-publication des modèles frontière (un processus formel est en cours de consultation à la Maison Blanche), avec un impact direct sur les calendriers de release attendus dans les prochains mois. 

OpenAI crée une filiale de déploiement à 4 milliards de dollars et rachète Tomoro

OpenAI a annoncé le 11 mai le lancement de l'OpenAI Deployment Company, une entité majoritairement contrôlée par OpenAI mais financée par un syndicat de 19 investisseurs (mené par TPG avec Advent, Bain Capital, Brookfield, Goldman Sachs et SoftBank) pour 4 milliards de dollars, valorisée 14 milliards. La structure embarque trois grands cabinets de conseil (McKinsey, Bain & Company, Capgemini) en tant que partenaires d'intégration et acquiert simultanément Tomoro, cabinet londonien de 150 ingénieurs spécialisés. La filiale a pour mission d'envoyer des Forward Deployed Engineers directement chez les clients pour redessiner leurs workflows autour des modèles d'OpenAI. C'est un basculement structurant : OpenAI cesse d'être un fournisseur de modèles pour devenir un acteur du conseil opérationnel, sur le terrain historique d'Accenture et des Big Four (dont les actions ont chuté après l'annonce). 

SAP dévoile l'Autonomous Enterprise et intronise Claude comme moteur de raisonnement

Lors de SAP Sapphire 2026 à Orlando le 11 mai, Christian Klein a présenté l'Autonomous Enterprise, refonte structurelle du portefeuille SAP autour de plus de 200 agents IA et 50 assistants spécialisés couvrant finance, supply chain, achats, RH et expérience client. La plateforme SAP Business AI Platform unifie Business Technology Platform, Business Data Cloud et Business AI sur un Knowledge Graph commun. SAP officialise dans la foulée un partenariat stratégique avec Anthropic faisant de Claude le moteur de raisonnement principal embarqué dans Joule, son orchestrateur d'agents. Pour les directions métier, l'enjeu est concret : un trésorier peut désormais demander à Joule de préparer une note pour le directeur financier avec données et risques en temps réel, là où le travail prenait plusieurs heures. SAP joue sa survie face à la défiance boursière (action en recul de 41% sur six mois) en pariant que la valeur résidera dans la couche de processus métier plutôt que dans le modèle lui-même. 

AWS reconfigure Amazon Connect en quatre suites agentiques sectorielles

Lors de l'événement What's Next with AWS le 5 mai à San Francisco, AWS a annoncé l'éclatement d'Amazon Connect en quatre solutions verticales pilotées par agents IA : Connect Decisions (planification supply chain), Connect Talent (recrutement), Connect Customer (expérience client) et Connect Health (parcours de soins, vérification patient, codage médical, documentation ambiante). En parallèle, Amazon Quick (assistant de productivité connecté aux outils de l'entreprise, en applications de bureau désormais) ouvre des plans Free et Plus accessibles sans compte AWS. AWS a également étendu son partenariat avec OpenAI : GPT-5.5 et GPT-5.4 arrivent sur Amazon Bedrock, l'agent de coding Codex est désormais accessible via Bedrock, et de nouveaux Bedrock Managed Agents propulsés par OpenAI entrent en preview. Pour les DSI, c'est l'aboutissement d'une stratégie de neutralité multi-modèle qui contraste avec l'approche historique de Microsoft sur Azure. 

Vous souhaitez recevoir les prochaines News IA by PN
news
Vous souhaitez recevoir les prochaines News IA by PN
Contactez-nous !
Guillaume Merlen
Guillaume Merlen
Plan.Net
Directeur Général
Contactez-nous !
Veuillez saisir une adresse e-mail valide

This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.