GPT-5.6 n'est pas un modèle, c'en est trois : Sol, Terra et Luna, présentés par OpenAI le 26 juin 2026. C'est l'essentiel à comprendre d'emblée, car les paliers ne sont pas juste rapide contre lent, c'est une échelle de prix délibérée visant des tâches différentes. Sol est le fleuron de la frontière avec un nouveau mode ultra. Terra est le cheval de trait qui égale le précédent GPT-5.5 à environ moitié prix. Luna est le palier rapide et bon marché pour la tuyauterie à gros volume. Choisir le mauvais gaspille de l'argent ou sous-alimente la tâche, alors la vraie compétence est le routage. Voici ce qui sépare les trois, et comment envoyer chaque tâche au palier qui lui revient. Un bémol d'emblée : GPT-5.6 reste une préversion limitée, donc c'est surtout de la planification, pas encore de la mise en prod.
The short answer
GPT-5.6, c'est trois paliers, pas un. Sol est le fleuron de la frontière avec un nouveau mode ultra et des sous-agents, pour le raisonnement dur, les agents et le code complexe. Terra égale le précédent GPT-5.5 à environ moitié du prix de Sol et couvre l'essentiel de la production. Luna est le palier rapide et bon marché pour les requêtes simples à gros volume. On route par la tâche. Et attention : tout ça reste une préversion limitée.
Quand OpenAI a présenté GPT-5.6 le 26 juin 2026, la nouvelle n'était pas un seul modèle mais une famille scindée en trois paliers, chacun visant une tâche et un budget différents. Cette structure est tout l'enjeu : au lieu d'un modèle que vous payez au tarif fleuron que la tâche soit dure ou triviale, vous routez. Bien router coupe une facture radicalement sans perdre la qualité là où elle compte. Mal router fait soit surpayer le travail simple, soit sous-alimenter le dur. C'est donc moins une comparaison « lequel est le meilleur » (Sol, évidemment, en capacité brute) qu'un guide pour envoyer chaque tâche à la bonne porte.
Les trois paliers en un coup d'oeil
| Palier | Prix, par 1M (entrée/sortie) | Idéal pour | Notes |
|---|---|---|---|
| Sol | ~$5 / $30 | Agents autonomes, raisonnement dur, code complexe, recherche | Fleuron ; mode ultra avec sous-agents ; plus grand contexte |
| Terra | ~$2,50 / $15 | Chatbots, RAG, API de production standard | Égale GPT-5.5 à ~moitié de Sol ; ~70 à 80 % de la prod |
| Luna | ~$1 / $6 | Classification, routage, prétraitement, gros volume | Le palier le plus rapide et le moins cher |
L'échelle est nette : chaque marche est à peu près moitié du prix de celle du dessus. C'est ce qui rend le routage par palier payant, les économies sont grandes et prévisibles.
Sol : le fleuron
Sol est le modèle qu'on imagine en pensant GPT-5.6. Il a la plus grande fenêtre de contexte des trois et les meilleurs scores en raisonnement, code et résolution multi-étapes. Sa fonction phare est le mode ultra, qui va au-delà d'un seul agent en orchestrant des sous-agents, couplé à un nouvel effort de raisonnement maximal pour les problèmes les plus durs. Sur Terminal-Bench 2.1 il marque 88,8, et le mode ultra atteint 91,9, le sommet du terrain actuel.
Sol est le bon choix quand la tâche a vraiment besoin de la frontière : agents autonomes exécutant de longs plans multi-étapes, génération de code complexe, et recherche ou analyse scientifique où la profondeur de raisonnement en plus et le plus grand contexte paient. C'est aussi le plus cher de loin, alors la discipline est de le réserver aux tâches qui justifient vraiment 30 dollars le million en sortie.
Terra : le cheval de trait
Terra est le palier où vivront la plupart des équipes. Il offre à peu près la qualité du précédent GPT-5.5 à environ moitié du prix de Sol, ce qui couvre la grande majorité du vrai travail de production : chatbots face au client, pipelines RAG, et API de production standard. Le cadrage d'OpenAI, et la plupart des tests précoces, le placent à gérer 70 à 80 pour cent des charges de production sans baisse de qualité notable.
La lecture pratique : si vous alliez tout mettre par défaut sur le fleuron, Terra est le palier qui dit non. Envoyez le gros de votre trafic ici, et n'escaladez que les requêtes vraiment dures vers Sol. Pour la plupart des applications, Terra est le défaut raisonnable et le plus gros levier unique sur votre facture.
Luna : le palier volume
Luna est le plus bon marché et le plus rapide, et il est bâti pour une forme de travail précise : de gros volumes de requêtes relativement simples. Pensez pipelines de prétraitement, classification et couches de routage, le code qui décide quel modèle en aval doit traiter une requête, ou qui nettoie et étiquette des données avant qu'un plus gros modèle ne les voie. À environ 1 dollar en entrée et 6 en sortie le million, il est à peu près un cinquième du prix de Sol.
Le schéma classique est de mettre Luna en tête d'un pipeline comme routeur : il trie chaque requête entrante à bas coût et n'escalade que celles qui ont besoin de Terra ou Sol. Utilisé ainsi, Luna ne concurrence pas les gros paliers, il est ce qui rend leur exploitation abordable à l'échelle.
Comment router
Toute la famille devient simple dès qu'on cesse d'y penser comme trois modèles pour y penser comme une décision de routage.
C'est toute la stratégie : un palier bon marché trie, un palier cheval de trait gère le gros, et le fleuron est réservé à la petite part de travail qui en a vraiment besoin. C'est le même jeu que les équipes malignes mènent déjà entre familles de modèles, et GPT-5.6 l'emballe dans une seule.
Alors, lequel utiliser ?
Si vous pouviez l'utiliser aujourd'hui, la plupart des équipes prendraient Terra par défaut, escaladeraient les tâches les plus dures vers Sol, et mettraient Luna en tête comme routeur bon marché. Ce routage à trois paliers est tout le design, et c'est un bon. Le hic, et il est de taille pour l'instant, c'est l'accès : GPT-5.6 est une préversion limitée à environ 20 organisations, pas dans ChatGPT, avec une disponibilité générale promise dans les semaines à venir.
En attendant l'ouverture, le bon réflexe est de planifier votre routage maintenant et, s'il vous faut un modèle comparable réellement livrable aujourd'hui, regardez Claude Sonnet 5, que nous opposons à GPT-5.6 dans Claude Sonnet 5 vs GPT-5.6, et classons face au reste dans notre guide meilleur modèle IA pour coder en 2026.
Sources et pour aller plus loin
- OpenAI, previewing GPT-5.6 Sol
- GPT-5.6 Sol, Terra et Luna expliqués (DataCamp)
- Tarifs GPT-5.6 : paliers Sol, Terra, Luna (Finout)
- OpenAI présente GPT-5.6, préversion limitée (VentureBeat)
Questions fréquentes
Quelle différence entre GPT-5.6 Sol, Terra et Luna ?
Ce sont trois paliers d'une même famille. Sol est le fleuron, le plus capable, avec le plus grand contexte, les meilleurs benchmarks et un nouveau mode ultra qui utilise des sous-agents, à environ 5 dollars le million en entrée et 30 en sortie. Terra est le milieu équilibré, offrant à peu près la qualité du précédent GPT-5.5 à environ moitié du prix de Sol (2,50 et 15). Luna est le plus bon marché et le plus rapide, bâti pour les requêtes simples à gros volume, à environ 1 et 6. Même famille, trois points de prix et de capacité très différents.
Quel palier GPT-5.6 utiliser ?
Routez par la tâche. Utilisez Luna pour de gros volumes de travail simple comme la classification, le routage et le prétraitement, où le coût par appel domine. Utilisez Terra pour l'essentiel du trafic de production, chatbots, pipelines RAG et API standard, puisqu'il gère environ 70 à 80 pour cent des charges de production sans baisse de qualité notable. Utilisez Sol pour la frontière, agents multi-étapes autonomes, raisonnement dur, code complexe et recherche. Un schéma courant : un palier bon marché décide quelles requêtes escalader vers Sol.
Combien coûte GPT-5.6 ?
Par million de tokens, Sol est à environ 5 dollars en entrée et 30 en sortie ; Terra à environ 2,50 et 15 ; et Luna à environ 1 et 6. Terra est donc à peu près moitié de Sol, et Luna à peu près un cinquième. Ce sont des tarifs de préversion qui peuvent bouger avant la disponibilité générale, alors vérifiez les chiffres du moment, mais la forme de l'échelle, chaque marche environ moitié de celle du dessus, est la partie utile pour planifier un budget.
Peut-on déjà utiliser GPT-5.6 ?
Pas de manière générale. À sa préversion de juin 2026, GPT-5.6 est limité à un ensemble restreint d'environ 20 organisations, après qu'OpenAI a partagé les modèles et son calendrier avec le gouvernement américain. L'accès se fait via l'API et l'outil Codex, pas ChatGPT, et une sortie générale est prévue dans les semaines à venir. Si vous avez besoin d'un modèle comparable réellement utilisable aujourd'hui, Claude Sonnet 5 est disponible, et nous comparons les deux dans notre analyse Claude Sonnet 5 vs GPT-5.6.
Quelle fenêtre de contexte pour GPT-5.6 ?
OpenAI n'a pas confirmé officiellement la fenêtre de contexte à la préversion. Le précédent GPT-5.5 offrait une fenêtre d'un million de tokens, et GPT-5.6 est largement attendu au même niveau, Sol portant la plus grande des trois. Traitez le chiffre exact comme non confirmé jusqu'à ce qu'OpenAI publie les spécifications finales, mais tablez sur une classe d'environ un million de tokens pour le fleuron.