Claude Sonnet 5 vs Opus 4.8 : quand payer plus

Claude Sonnet 5 contre Opus 4.8 est une comparaison rare, car pour une fois le modèle le moins cher n'est pas franchement le plus faible. Anthropic a sorti Sonnet 5 le 30 juin 2026, et sa propre description le dit tout haut : des performances proches d'Opus 4.8 au tarif Sonnet. Les benchmarks le confirment. Sonnet 5 se situe à quelques points d'Opus sur la plupart des tests, en gagne même certains, tout en coûtant 40 pour cent de moins, ou 60 pour cent pendant la période d'introduction. La vraie question n'est donc pas lequel est meilleur, elle est plus fine et plus utile : quand la marge en plus d'Opus 4.8 vaut-elle vraiment presque le double du prix. Voici la réponse honnête, chiffres de lancement à l'appui.

The short answer

Claude Sonnet 5 ($3/$15, intro $2/$10) se situe à quelques points d'Opus 4.8, gagnant même Terminal-Bench et le travail professionnel, pour 40 à 60 pour cent de moins. Claude Opus 4.8 ($5/$25) reste le leader là où ça compte le plus : le code le plus profond (SWE-bench Pro 69,2) et le raisonnement le plus dur (maths de concours 96,7 contre 79,5). Même API, donc routez les tâches dures vers Opus et le reste vers Sonnet 5.

40% moins cherSonnet 5 vs Opus 4.8 (60% intro)

63,2 vs 69,2SWE-bench Pro

80,4 vs 74,6Terminal-Bench : Sonnet 5 gagne

Carte de réponse : Claude Sonnet 5 coûte 40 à 60 pour cent de moins et gagne Terminal-Bench 80,4 contre 74,6, tandis qu'Opus 4.8 mène SWE-bench Pro 69,2 contre 63,2 et les maths de concours 96,7 contre 79,5. Même API, donc on route par tâche. — Qualité proche d'Opus au tarif Sonnet. Ne payez le supplément Opus que là où vivent les problèmes les plus durs. PNG

Pendant presque deux ans, choisir un modèle Claude était simple : Opus pour le dur, Sonnet pour le volume, et on acceptait une vraie baisse de qualité pour le palier moins cher. Sonnet 5 casse ce schéma. C'est le premier Sonnet qui se rapproche assez d'Opus pour que, comme le dit Anthropic, Opus commence à paraître optionnel pour la plupart des charges. Ça ne rend pas Opus 4.8 inutile, ça rend la décision plus nette. Donc au lieu de « lequel est meilleur » (Opus, de peu, globalement), la question utile est : où le supplément achète-t-il vraiment quelque chose. Et si vous voulez voir Sonnet 5 face à OpenAI, notre comparatif Claude Sonnet 5 vs GPT-5.6 en parle.

Le verdict rapide

Vous survolez ? Le voici.

Vous...	Le choix	Pourquoi
Faites l'essentiel du code et de l'agentique	Sonnet 5	À quelques points, 40 à 60 % moins cher
Tournez à gros volume	Sonnet 5	L'écart de prix se cumule vite
Attaquez le raisonnement ou les maths les plus durs	Opus 4.8	96,7 contre 79,5 en maths de concours
Faites les changements de code les plus profonds	Opus 4.8	Mène SWE-bench Pro, 69,2 contre 63,2
Dans le doute	Sonnet 5, escalade vers Opus	Même API, swap d'un mot au besoin

Le défaut honnête à la mi-2026, c'est Sonnet 5, avec Opus 4.8 gardé en réserve pour les tâches qui ont vraiment besoin du plafond.

Benchmarks, face à face

Ce sont les chiffres de lancement, sur les tests où les deux ont publié, donc un face-à-face équitable.

Benchmark	Ce qu'il mesure	Claude Sonnet 5	Claude Opus 4.8
SWE-bench Pro	Vraies pull requests de dépôt	63,2	69,2
Terminal-Bench 2.1	Piloter un terminal, tâches d'agent	80,4	74,6
GDPval-AA v2 (Elo)	Travail de connaissance professionnel	1618	1603
HLE avec outils	Examen de raisonnement dur	57,4	57,9
USAMO 2026	Maths de concours par preuves	79,5	96,7

Lisez-le comme une forme, pas un tableau des scores. Sur quatre des cinq, ils sont à une poignée de points et Sonnet 5 en prend même deux. L'exception est USAMO, l'olympiade de maths par preuves, où l'avance de 17 points d'Opus 4.8 est le plus grand écart de toute la comparaison et un signe clair de là où sa profondeur de raisonnement en plus se voit.

Là où Opus 4.8 mérite le supplément

Deux endroits, et ils sont précis. D'abord, le raisonnement le plus dur. Cet écart USAMO n'est pas du bruit : les maths par preuves sont un indicateur d'un raisonnement long, rigoureux et multi-étapes qu'on ne peut pas simuler, et Opus 4.8 y est tout simplement meilleur. Si votre travail implique ce genre de réflexion, preuves complexes, décisions d'architecture délicates, arguments de justesse subtils, le supplément achète une vraie précision. Ensuite, le code le plus profond. Sur SWE-bench Pro, le benchmark des vraies pull requests, Opus 4.8 mène 69,2 contre 63,2. Sur un changement vraiment dur et tentaculaire, ces points se traduisent par moins de tentatives ratées.

Opus 4.8 est aussi le modèle le plus autonome d'Anthropic pour les runs agentiques au long cours, le palier code-toute-la-nuit, tâches de plusieurs heures. Quand le coût d'une mauvaise réponse est élevé et que la tâche est à la limite de ce que tout modèle sait faire, c'est l'instrument le plus sûr. Voilà tout l'argument pour payer plus : la justesse à la frontière.

Là où Sonnet 5 gagne

Partout ailleurs, c'est-à-dire la plupart des endroits. Il est 40 pour cent moins cher au tarif standard et 60 pour cent pendant l'introduction jusqu'au 31 août 2026, et comme la sortie domine une vraie facture, c'est le chiffre qui apparaît sur votre note. Il gagne Terminal-Bench 2.1 franchement (80,4 contre 74,6), donc pour le travail d'agent-en-terminal il est à la fois moins cher et meilleur. Il devance Opus sur le travail de connaissance professionnel, fait jeu égal sur l'examen de raisonnement avec outils, et se tient à quelques points sur le benchmark de code profond qu'il perd. Il tient le même contexte de 1M et la même réflexion à effort élevé.

Résultat : pour la grande majorité du code, du chat, de l'extraction et des tâches agentiques, vous auriez du mal à justifier le supplément Opus sur la seule qualité. Sonnet 5 est le premier Sonnet où c'est vrai.

Prix et bascule

Toute la décision au même endroit, plus ce qui la rend indolore : ils partagent une API, donc basculer est un changement d'un mot.

	Claude Sonnet 5	Claude Opus 4.8
Entrée, par 1M	~3 $ (intro ~2 $)	~5 $
Sortie, par 1M	~15 $ (intro ~10 $)	~25 $
Fenêtre de contexte	1 000 000	1 000 000
ID du modèle	`claude-sonnet-5`	`claude-opus-4-8`

Terminal montrant la même requête de l'API Anthropic avec la chaîne du modèle basculée entre claude-sonnet-5 et claude-opus-4-8, illustrant que router entre les deux est un changement d'un mot. — Même requête, un mot change. Par défaut Sonnet 5, escalade vers Opus 4.8 seulement quand la tâche a besoin du plafond. PNG

Cette surface partagée est ce qui rend le bon réflexe pratique : ne choisissez pas l'un pour toujours, routez par tâche. Envoyez le gros de votre trafic à Sonnet 5, et escaladez la poignée de tâches vraiment dures vers Opus 4.8, le tout sans toucher au reste de votre code.

Alors, lequel choisir ?

Par défaut, Claude Sonnet 5. À la mi-2026 c'est le choix valeur de loin : qualité proche d'Opus sur presque tout, une victoire nette sur les agents en terminal, et 40 à 60 pour cent de moins. Gardez Claude Opus 4.8 pour les tâches précises où son avance est réelle, le raisonnement et les maths les plus durs, et les changements de code les plus profonds, où les points en plus valent les dollars en plus.

Pour une vue plus large de leur place face au reste, voyez notre classement du meilleur modèle IA pour coder en 2026. Mais la version courte est simple : Sonnet 5 a fait de « prends juste Opus » le mauvais défaut pour la plupart des équipes, et c'est vraiment nouveau en 2026.

Sources et pour aller plus loin

Questions fréquentes

Opus 4.8 vaut-il presque le double du prix de Sonnet 5 ?

Pour la plupart des travaux, non, et Anthropic le dit à peu près. Sonnet 5 se situe à quelques points d'Opus 4.8 sur la plupart des benchmarks, et bat même Opus sur Terminal-Bench 2.1 (80,4 contre 74,6) et sur le score de travail professionnel GDPval. Opus 4.8 passe nettement devant à deux endroits : le code le plus profond, où il mène SWE-bench Pro à 69,2 contre 63,2, et le raisonnement le plus dur, où il marque 96,7 contre 79,5 sur les maths de concours par preuves, un écart de 17 points. Payez donc Opus quand la justesse sur les problèmes les plus durs vaut le supplément ; pour tout le reste, Sonnet 5 est le bon rapport.

De combien Claude Sonnet 5 est-il moins cher qu'Opus 4.8 ?

Au tarif standard, Sonnet 5 est à 3 dollars le million de tokens en entrée et 15 en sortie, contre 5 et 25 pour Opus 4.8. C'est 40 pour cent moins cher sur les deux. Jusqu'au 31 août 2026, un tarif d'introduction ramène Sonnet 5 à 2 et 10, soit 60 pour cent moins cher qu'Opus en entrée comme en sortie. Comme la sortie domine généralement une vraie facture, cet écart se cumule vite à volume.

Puis-je basculer entre Sonnet 5 et Opus 4.8 sans changer de code ?

Oui. Ils partagent la même API, le même SDK et le même outil Claude Code, donc basculer est un changement d'un mot dans la chaîne du modèle : claude-sonnet-5 ou claude-opus-4-8. Une stratégie de routage devient simple : envoyez le gros du travail à Sonnet 5 et réservez Opus 4.8 aux tâches les plus dures, sans rien réécrire. Les deux exposent aussi la réflexion adaptative et les mêmes niveaux d'effort.

Lequel est meilleur pour le code agentique ?

Ça se partage. Sur Terminal-Bench 2.1, qui mesure un modèle pilotant un terminal sur une tâche, Sonnet 5 devance en fait Opus 4.8, 80,4 contre 74,6. Sur SWE-bench Pro, bâti à partir de vraies pull requests, Opus 4.8 mène, 69,2 contre 63,2. Donc pour la plupart des boucles d'agent et du travail en terminal, Sonnet 5 est à la fois moins cher et compétitif ; visez Opus 4.8 quand la tâche est un changement profond et multi-étapes où les derniers points de justesse comptent.

Ont-ils la même fenêtre de contexte et le même raisonnement ?

Oui, la surface est la même. Les deux offrent une fenêtre de contexte de 1 000 000 de tokens et jusqu'à 128 000 tokens en sortie, et utilisent la réflexion adaptative avec un effort réglable de low à xhigh ou max. La différence entre eux est le palier de capacité et le prix, pas les fonctionnalités. C'est ce qui fait du choix une pure décision coût contre marge, plutôt qu'une comparaison de fonctionnalités.

Le verdict rapide

Benchmarks, face à face

Là où Opus 4.8 mérite le supplément

Là où Sonnet 5 gagne

Prix et bascule

Alors, lequel choisir ?

Sources et pour aller plus loin

Questions fréquentes

Pour aller plus loin

Cloudflare met les feature flags au terminal avec Wrangler

Walden Robotics sort de l'ombre avec 300 M$ pour ses robots

L'UE oblige Google a ouvrir Android et sa recherche

Testeur de compatibilité des API IA

Calculateur de coûts AI

Estimateur de risque de hallucination IA