La sortie d'Anthropic fin avril a fait moins de bruit qu'elle ne le mérite. Deux nouveautés ont atterri ensemble — Claude Opus 4.7 et Managed Agents en bêta publique — et une fonctionnalité a été retirée : la fenêtre de contexte de 1M de tokens pour Sonnet 4.5 et Sonnet 4, supprimée le 30 avril. Si tu fais tourner des agents en production sur la stack Claude, cette semaine est un point de décision, pas un simple "télécharger et installer".
On teste les trois depuis l'arrivée des en-têtes bêta, sur les mêmes cas qu'on livre à nos clients : triage de demandes pour cabinets d'avocats, agents de connaissance interne pour consultants, bots WhatsApp qui basculent vers un humain. Voici le verdict terrain : ce qu'on migrerait cette semaine, ce qu'on piloterait avant de s'engager, et ce qu'on ignorerait sans regret.
Ce qui a vraiment été livré — la version courte
Opus 4.7 sort au même prix qu'Opus 4.6 : 5 $ / 25 $ par million de tokens. Pas d'inflation, ce qui en fait l'une de ces rares sorties où "mettre à jour maintenant" est une décision quasi sans risque. Les améliorations qui comptent pour le travail d'agent : meilleurs benchmarks d'ingénierie logicielle (utile si tes agents écrivent ou modifient du code) et traitement d'images en plus haute résolution (utile pour les workflows OCR comme l'analyse de factures ou la revue de contrats).
Claude Managed Agents est le titre principal. C'est un harnais d'agent entièrement géré : exécution en sandbox, outils intégrés, streaming en server-sent events. Tu crées des agents, configures des conteneurs, et lances des sessions via l'API, derrière l'en-tête bêta `managed-agents-2026-04-01`. La mémoire pour ces agents est sortie sous le même en-tête.
La CLI ant est la fonctionnalité discrète au plus gros impact workflow — un client en ligne de commande pour l'API Claude avec intégration native Claude Code et versioning YAML des ressources API.
Élargissement Bedrock : Opus 4.7 et Haiku 4.5 sont maintenant disponibles en self-serve dans 27 régions AWS. Précieux si tu es coincé avec des déploiements VPC-only.
Retraits : Claude Haiku 3 (`claude-3-haiku-20240307`) est mort — les requêtes renvoient une erreur. La bêta de contexte 1M est retirée pour Sonnet 4.5 et Sonnet 4. Pour conserver le contexte 1M, migre vers Sonnet 4.6 ou Opus 4.6.
Pourquoi Managed Agents change les règles (et pourquoi tu pourrais attendre)
Le harnais Managed Agents, c'est Anthropic qui exécute la boucle d'agent à ta place — sandbox d'exécution, dispatch d'outils, flux d'événements SSE. Pour des agents greenfield où tu n'as pas encore d'opinion sur l'outillage, c'est un vrai gain de temps. On l'a piloté la semaine dernière sur un agent de triage client, et le harnais a géré retries, échecs partiels d'outils et réponses en streaming sans qu'on écrive un seul boilerplate.
Mais le compromis est réel, et il pèse sur les équipes qui ont déjà investi. Si tu as passé six mois à peaufiner un orchestrator custom avec budgets de retry, contrôle d'outils, observabilité et ranking maison de vector search — Managed Agents te demande d'abandonner tout ça pour une alternative gérée que tu ne contrôles pas totalement. L'optimisation des coûts devient plus difficile quand tu ne vois pas chaque limite de token. Les sorties de secours custom deviennent plus dures quand le harnais possède la boucle.
Notre verdict : pilote sur un agent à faible enjeu d'abord. Ne migre pas la prod. Le harnais est bon, mais la surface de lock-in n'est pas anodine — une fois que tes outils, ton schéma de mémoire et l'état de session vivent dans l'infra Anthropic, revenir à une boucle custom est un vrai projet.
La fin du contexte 1M — l'action urgente de la semaine
C'est l'élément urgent. Si l'un de tes pipelines passe l'en-tête `context-1m-2025-08-07` à Sonnet 4.5 ou Sonnet 4, il échoue durement depuis le 30 avril. Les options sont simples : migrer vers Sonnet 4.6 ou Opus 4.6 (toujours en 1M), ou refactorer en retrieval par chunks.
Verdict honnête : la plupart des agents qui prétendaient avoir besoin de 1M de contexte masquaient en réalité un mauvais retrieval. Si le coût de migration semble faible — c'est-à-dire que tu peux basculer en chunked + Pinecone ou pgvector sans casser le workflow — prends-le comme un signal pour reconstruire la couche de retrieval plutôt que de simplement augmenter le modèle. Un pipeline de retrieval bien tuné bat un dump de contexte 1M sur le coût, la latence et la qualité de réponse, dans cet ordre.
ant CLI + versioning YAML : le gain workflow discret
La nouvelle CLI est la fonctionnalité qu'on utilisera tous les jours. Les ressources API versionnées en YAML signifient que prompts d'agents, définitions d'outils et system prompts vont dans git en artefacts revus en PR et rollbackables. Les diffs de PR remplacent les screenshots Slack. La dérive de prompts entre staging et prod devient diffable au lieu de mystérieuse.
Si tu as déjà perdu un mardi à chercher quelle version de prompt tourne réellement en prod — voilà le fix. Pilote sur la config d'un seul agent d'abord ; ça changera ta façon de penser la gestion de changement de prompts.
Ce qu'il faut faire cette semaine
La liste de priorités claire :
- 1.Aujourd'hui : audite tout usage de l'en-tête `context-1m-2025-08-07`. Migre vers Sonnet 4.6 ou refactor en retrieval. Ne livre pas lundi avec des agents qui plantent.
- 2.Ce sprint : passe à Opus 4.7 partout où tu es sur 4.6. Même prix, gains gratuits.
- 3.Ce sprint : pilote ant CLI + YAML sur la config d'un agent. Habitue-toi à git-differ tes prompts.
- 4.Ce trimestre : POC Managed Agents sur un agent greenfield. Ne migre pas la prod tout de suite.
Chez Veya Studio on construit des Brains IA pour experts indépendants et cabinets boutique en services professionnels — droit, expertise comptable, conseil, stratégie retail. Les boucles de production tournent sur notre orchestrator Trigger.dev + Hono, avec Pinecone pour la mémoire et Supabase pour l'état, après notre migration de n8n plus tôt cette année. Si tu cadres où Managed Agents devrait s'insérer dans ton propre stack — ou bloqué sur la migration 1M avec un deadline serré — c'est exactement le type de décision d'architecture que notre Brain Discovery tranche.
Pistes d'articles à suivre :
- 1.Migrer d'une boucle d'agent custom vers Claude Managed Agents : le playbook praticien
- 2.Remplacer le contexte 1M par un vrai retrieval : quand le chunking bat la fenêtre élargie
- 3.Versionner les prompts d'agents dans git : YAML, ant CLI, et la fin de la "dérive de prompts"
