DevReview

Claude Sonnet 5 vs GPT-5.6 : code, coût, accès

Sur cette page
  1. Le verdict rapide
  2. Qui gagne quoi
  3. Là où Claude Sonnet 5 gagne
  4. Là où GPT-5.6 gagne
  5. Prix et accès
  6. Alors, lequel choisir ?
  7. Sources et pour aller plus loin

Claude Sonnet 5 contre GPT-5.6, c'est la question du modèle de code du moment, et elle vient avec une torsion inhabituelle : un seul des deux est réellement utilisable aujourd'hui. Anthropic a sorti Claude Sonnet 5 le 30 juin 2026, disponible sur toutes les offres, via l'API, et dans Claude Code, son outil de code agentique. OpenAI a présenté GPT-5.6 (un trio nommé Sol, Terra et Luna) quelques jours plus tôt, mais en préversion limitée réservée à des partenaires de confiance, pas encore dans ChatGPT. La lecture honnête est donc à deux faces : sur les benchmarks bruts les deux se rendent coup pour coup, mais sur la disponibilité, le prix et le fait de livrer maintenant, l'image penche nettement. Voici où chacun gagne, avec les chiffres de lancement et sans battage.

The short answer

Deux fleurons, un seul réellement utilisable. Claude Sonnet 5 est disponible aujourd'hui, y compris dans Claude Code, coûte environ moitié moins en sortie que le palier Sol de GPT-5.6, mène le benchmark des vraies pull requests SWE-bench Pro (63,2), et tient un contexte de 1M. GPT-5.6 (Sol, Terra, Luna) domine les benchmarks terminal et d'environnement d'agent et devance sur HumanEval, mais c'est une préversion limitée pour partenaires de confiance, pas encore dans ChatGPT.

Dispo maintenantSonnet 5 GA ; GPT-5.6 préversion
~2x moins chersortie Sonnet 5 vs GPT-5.6 Sol
63,2Sonnet 5 SWE-bench Pro
Carte de réponse : Claude Sonnet 5 est disponible aujourd'hui, y compris dans Claude Code, coûte environ moitié moins en sortie et mène le SWE-bench Pro à 63,2, tandis que GPT-5.6 domine Terminal-Bench et devance HumanEval mais reste une préversion limitée pour partenaires de confiance.
Toute la décision sur une carte. Livré aujourd'hui et moins cher, ou en tête des benchmarks agentiques mais difficile à obtenir. PNG

Depuis un an, la course en tête oppose Anthropic et OpenAI qui se reprennent la première place tous les deux ou trois mois, et la dernière semaine de juin 2026 a été un nouvel échange. Anthropic a sorti Claude Sonnet 5, un modèle de la gamme Sonnet qui atteint ce qui était naguère la qualité Opus sur le code, et l'a rendu disponible partout d'un coup. OpenAI a répondu par une préversion de GPT-5.6, une famille de trois modèles avec un record de benchmark terminal en titre. Mais « disponible partout » contre « préversion pour partenaires de confiance », c'est la différence qui façonne toute cette comparaison, alors on la traite comme un facteur de premier plan, pas comme une note de bas de page. Voici le partage honnête, chiffres de lancement sous les yeux.

Une précision rapide, car le nom fait trébucher : Claude Code est l'outil de code agentique d'Anthropic, un assistant en terminal qui édite votre dépôt et exécute des commandes. Claude Sonnet 5 est le modèle qui l'anime désormais. « Claude Code Sonnet 5 » n'est donc pas un nouveau produit, c'est Sonnet 5 qui fait le travail dans Claude Code.

Le verdict rapide

Vous survolez ? Le voici, selon qui vous êtes.

Vous...Le choixPourquoi
Livrez du code cette semaineClaude Sonnet 5Disponible, y compris dans Claude Code
Sensible au coût à l'échelleClaude Sonnet 5Environ moitié du prix de sortie de GPT-5.6 Sol
Bâtissez des agents terminal / environnementGPT-5.6 (Sol)En tête de Terminal-Bench ; le mode ultra ajoute des sous-agents
Partenaire de confiance avec accès préversionGPT-5.6Scores agentiques de pointe, si vous y avez accès
Travaillez dans Claude CodeClaude Sonnet 5C'est le modèle de code par défaut

Cette première ligne, c'est toute l'histoire en miniature : pour la plupart des gens, un seul de ces deux modèles est réellement utilisable aujourd'hui.

Qui gagne quoi

Le tableau des benchmarks est vraiment partagé, et les chiffres ci-dessous sont ceux du lancement. Il n'y a pas de comparaison parfaitement identique parce que les deux labos publient sur des tests différents, alors voici la vue honnête « qui mène chaque dimension ».

DimensionAvantageDétail
Code classique (HumanEval)GPT-5.692,3 contre 89,7 pour Sonnet 5
Terminal / environnement d'agent (Terminal-Bench 2.1)GPT-5.6Sol 88,8, mode ultra 91,9, au-dessus de tout Claude dont Opus 4.8 à 78,9
Vraies pull requests (SWE-bench Pro)Claude Sonnet 563,2 (chiffre de GPT-5.6 pas encore publié)
Prix de sortieClaude Sonnet 5Environ 15 dollars le million contre 30 pour Sol
Disponible aujourd'huiClaude Sonnet 5GA partout contre la préversion limitée de GPT-5.6

Le motif : GPT-5.6 possède le bout piloter-la-machine, conduire-le-terminal du code, où son mode ultra et ses sous-agents brillent. Claude Sonnet 5 possède le bout écrire-et-corriger-une-vraie-pull-request, plus tout ce qui touche au fait de pouvoir réellement y mettre les mains.

Là où Claude Sonnet 5 gagne

Trois choses, et elles se cumulent. D'abord, vous pouvez l'utiliser maintenant. Il est disponible sur toutes les offres, sur l'API, et dans Claude Code, ce qui pour la plupart des équipes est toute la partie face à un modèle encore verrouillé derrière une préversion partenaires. Ensuite, le prix. À environ 3 dollars le million en entrée et 15 en sortie (avec une intro à 2 et 10 jusqu'au 31 août 2026), il tourne à peu près à la moitié du coût de sortie du palier Sol de GPT-5.6. Sur une vraie facture, où la sortie domine, cet écart fait la différence entre une fonctionnalité abordable et une qui ne l'est pas.

Troisièmement, le code lui-même est proche d'Opus. Sur SWE-bench Pro, le benchmark bâti à partir de vraies pull requests de dépôt et celui auquel la plupart des équipes se fient comme indicateur du travail en production, Sonnet 5 mène à 63,2. Il tient un contexte de 1 000 000 de tokens, prend les images en haute résolution, et dans Claude Code il tourne à effort élevé et mène les boucles d'agent de bout en bout. Le bémol honnête : sur les tâches de terminal et de raisonnement abstrait les plus exigeantes, GPT-5.6 est devant, et si la performance agentique de pointe est tout l'enjeu, ça compte.

Là où GPT-5.6 gagne

GPT-5.6 est bâti pour la frontière du code agentique, et son chiffre phare le confirme. Sur Terminal-Bench 2.1, qui mesure un modèle pilotant un terminal sur une vraie tâche, Sol marque 88,8 et son nouveau mode ultra atteint 91,9, au-dessus de tout modèle Claude connu, Opus 4.8 compris. Le mode ultra est la partie intéressante : il va au-delà d'un seul agent en orchestrant des sous-agents, et OpenAI l'a couplé à un nouvel effort de raisonnement maximal pour les problèmes les plus durs. Il devance aussi Sonnet 5 sur le test de code classique HumanEval, 92,3 contre 89,7.

La structure en famille est un vrai atout aussi. Sol est le fleuron, Terra égale le précédent GPT-5.5 à environ moitié prix, et Luna est le palier rapide et bon marché, de quoi router les appels faciles vers un modèle plus léger. Le hic, et il est de taille pour l'instant, c'est l'accès : GPT-5.6 est une préversion limitée pour partenaires de confiance via l'API et Codex, pas dans ChatGPT, avec une disponibilité générale promise dans les semaines à venir. Tant que ça n'arrive pas, la plupart de ces forces restent sur le papier pour la plupart des développeurs.

Prix et accès

Le partage qui décide beaucoup de projets, au même endroit. Les prix sont ceux du lancement et de la préversion et bougent souvent, alors prenez-les comme la forme de l'écart, pas comme parole d'évangile.

Claude Sonnet 5GPT-5.6
Entrée, par 1M~3 $ (intro ~2 $)Sol ~5 $ · Terra ~2,50 $ · Luna ~1 $
Sortie, par 1M~15 $ (intro ~10 $)Sol ~30 $ · Terra ~15 $ · Luna ~6 $
Fenêtre de contexte1 000 000classe ~1 000 000
DisponibilitéGA : toutes offres, API, Claude CodePréversion limitée (API + Codex, partenaires)

L'accès est là où ils divergent le plus, et il faut être franc : vous pouvez commencer à bâtir sur Sonnet 5 dans les cinq prochaines minutes, et vous ne pouvez sans doute pas commencer sur GPT-5.6 du tout, sauf à figurer sur la liste de partenaires d'OpenAI.

Terminal montrant Claude Sonnet 5 lancé dans Claude Code en une commande, à côté d'un appel GPT-5.6 via l'API OpenAI dont la sortie indique que l'accès à la préversion est limité aux partenaires de confiance.
L'un se lance d'une commande aujourd'hui ; l'autre s'appelle par API seulement si vous avez l'accès préversion. PNG

Cet écart est le cœur pratique de toute la comparaison : les benchmarks sont serrés et partagés, mais un modèle est dans votre terminal maintenant et l'autre est derrière une porte de préversion.

Alors, lequel choisir ?

Deux cas nets. Si vous écrivez et livrez du code, voulez une qualité proche d'Opus à des prix Sonnet, tenez au coût à volume, ou avez simplement besoin d'un modèle utilisable aujourd'hui, Claude Sonnet 5 est le choix, et c'est l'évidence dans Claude Code. Si vous bâtissez des agents pilotés par terminal ou en computer-use, visez le tout haut des benchmarks agentiques, et disposez de l'accès préversion (ou acceptez d'attendre la disponibilité générale), GPT-5.6, surtout Sol avec le mode ultra, est la frontière.

Pour la plupart des développeurs qui lisent ceci à la mi-2026, le départage n'est pas un benchmark, c'est le calendrier : Claude Sonnet 5 est là, GPT-5.6 est presque là. Quand GPT-5.6 passera en disponibilité générale, ce sera un match bien plus serré, benchmark par benchmark. En attendant, le modèle que vous pouvez réellement faire tourner a un très gros avantage, et il se trouve que c'en est un excellent.

Sources et pour aller plus loin

Questions fréquentes

Lequel est meilleur pour le code, Claude Sonnet 5 ou GPT-5.6 ?

C'est serré, et ils gagnent des benchmarks différents. GPT-5.6 Sol devance sur le test classique HumanEval (92,3 contre 89,7) et mène nettement le travail en terminal et en environnement d'agent, où son mode ultra marque 91,9 sur Terminal-Bench 2.1, au-dessus de tout Claude connu, Opus 4.8 compris. Claude Sonnet 5 mène le SWE-bench Pro, le benchmark bâti à partir de vraies pull requests, à 63,2, et il approche la qualité d'Opus 4.8 pour bien moins cher. Donc GPT-5.6 pour le terminal et l'agentique de pointe, Claude Sonnet 5 pour le code de vraies pull requests, et honnêtement les deux sont excellents au quotidien.

Peut-on utiliser GPT-5.6 dès maintenant ?

Pas de manière générale, et c'est la plus grande différence pratique. À sa préversion de juin 2026, GPT-5.6 Sol, Terra et Luna sont réservés à des partenaires de confiance via l'API et l'outil Codex. Ils ne sont pas dans ChatGPT, et la disponibilité générale est promise dans les semaines à venir. Claude Sonnet 5, à l'inverse, est disponible aujourd'hui : c'est le modèle par défaut des offres Free et Pro, il est sur Max, Team et Enterprise, sur l'API, et il tourne dans Claude Code. Si vous devez construire quelque chose cette semaine, un seul des deux est réellement une option pour la plupart des gens.

Combien coûtent Claude Sonnet 5 et GPT-5.6 ?

Claude Sonnet 5 est autour de 3 dollars le million de tokens en entrée et 15 en sortie, avec un tarif d'introduction à 2 et 10 jusqu'au 31 août 2026. GPT-5.6 se décline en trois paliers : Sol, le fleuron, autour de 5 et 30 ; Terra, qui égale GPT-5.5 à environ 2,50 et 15 ; et Luna, le palier rapide et bon marché à environ 1 et 6. Sonnet 5 coûte donc à peu près moitié moins que Sol en sortie, tandis que les paliers Terra et Luna de GPT-5.6 passent en dessous si vous acceptez un modèle plus petit. Les prix bougent, vérifiez les tarifs du moment avant d'engager un budget.

Qu'est-ce que Claude Code, et comment Sonnet 5 s'y intègre ?

Claude Code est l'outil de code agentique d'Anthropic : un assistant en ligne de commande qui lit votre dépôt, édite des fichiers, exécute des commandes et mène une tâche à son terme. Ce n'est pas un modèle. Claude Sonnet 5 est le nouveau modèle qui l'anime, en tournant à effort élevé pour le code et les boucles d'agent. « Claude Code Sonnet 5 » signifie donc simplement utiliser Sonnet 5 via Claude Code, pas un produit à part. On peut aussi pointer Claude Code vers d'autres modèles Claude, mais Sonnet 5 est le modèle de code par défaut sur les offres Free et Pro.

Quelle fenêtre de contexte et quel raisonnement ?

Claude Sonnet 5 arrive avec une fenêtre de contexte de 1 000 000 de tokens et jusqu'à 128 000 tokens en sortie, avec une réflexion adaptative dont vous réglez la profondeur de low à xhigh ou max. GPT-5.6 se situe dans la même classe d'environ un million de tokens et ajoute un nouvel effort de raisonnement maximal plus un mode ultra qui va au-delà d'un seul agent en utilisant des sous-agents. Les deux tiennent une grande base de code en contexte confortablement, donc pour la plupart des travaux la fenêtre n'est pas ce qui les départage.