TerminalBench 91,9 % · CTF 96,7 % · preview gouvernementale · Cerebras 750 token/s
Le 26 juin 2026, OpenAI a publié la famille GPT-5.6 — flagship Sol, équilibré Terra et léger Luna — avec une première nomenclature inspirée du système solaire. Sol domine TerminalBench 2.1 à 91,9 % et atteint 96,7 % aux évaluations CTF cybersécurité. Les trois modèles ont franchi le seuil High d’OpenAI en cybersécurité. En raison d’une revue de sécurité du gouvernement américain, seules environ 20 organisations partenaires vérifiées y ont accès aujourd’hui. Ce guide couvre tarifs et positionnement, tous les benchmarks majeurs, l’accélération Cerebras, les retombées politiques de juin, le face-à-face avec Claude Mythos 5, le calendrier d’accès, les cas d’usage, l’architecture de sécurité et la FAQ.
| Modèle | Positionnement | Prix entrée | Prix sortie | Point fort |
|---|---|---|---|---|
| GPT-5.6 Sol | Flagship / capacité maximale | 5 $ / 1M tokens | 30 $ / 1M tokens | TerminalBench 2.1 #1 (91,9 %) |
| GPT-5.6 Terra | Équilibré / polyvalent | 2,50 $ / 1M tokens | 15 $ / 1M tokens | Proche de GPT-5.5, 50 % moins cher |
| GPT-5.6 Luna | Léger / rapide | 1 $ / 1M tokens | 6 $ / 1M tokens | Volume élevé, 80 % moins cher que Sol |
Statut actuel : À la demande du gouvernement américain, GPT-5.6 est limité à environ 20 organisations partenaires approuvées. Disponibilité élargie attendue sous quelques semaines. Fenêtre de contexte rapportée à environ 1,5 M tokens (confirmation officielle avec la system card complète en attente).
OpenAI a lancé GPT-5.6 le 26 juin 2026 avec un nouveau système de nommage céleste : Sol (le Soleil) pour le flagship, Terra (la Terre) pour le milieu de gamme et Luna (la Lune) pour le tier léger.
Le déploiement n’a pas été fluide. Suite à l’ordre exécutif du 2 juin du président Trump, la Maison Blanche a coordonné l’OSTP et l’ONCD pour exiger une revue de sécurité gouvernementale avant toute diffusion large. C’est la première fois que le gouvernement américain impose formellement à une entreprise d’IA de restreindre le lancement d’un modèle frontier. Le PDG Sam Altman a annoncé la coopération, tout en contestant publiquement :
« Nous ne pensons pas que ce type de processus d’accès gouvernemental devrait devenir la norme à long terme. Il prive utilisateurs, développeurs, entreprises, défenseurs cyber et partenaires mondiaux des meilleurs outils dont ils ont besoin. »
La plupart des utilisateurs et entreprises ne peuvent pas encore accéder à GPT-5.6 via ChatGPT ou l’API publique
Juin 2026 devait être un « super mois de lancement », mais OpenAI, Anthropic et Google ont tous vu leurs sorties flagship bloquées ou retardées
La preview limitée signifie que workflows Agent, intégration Codex et reproduction de benchmarks attendront peut-être des semaines jusqu’en juillet
L’incertitude politique ajoute un coût caché au choix de modèle et à la planification budgétaire
Les équipes devraient préparer un environnement de dev macOS pour valider les capacités du modèle dès l’ouverture de l’accès
Sol est le modèle le plus capable d’OpenAI à ce jour, conçu pour la programmation exigeante, la recherche cybersécurité à long horizon et les workflows agentiques multi-étapes.
Deux nouveaux modes de raisonnement :
Tarifs : 5 $ / 1M tokens en entrée, 30 $ / 1M en sortie (identique à GPT-5.5)
Terra est le cheval de bataille entreprise pour le support client à volume, les outils internes et l’analyse documentaire. Performance proche de GPT-5.5 à 50 % de coût en moins — meilleur rapport qualité-prix pour le déploiement à grande échelle. Tarifs : 2,50 $ / 1M entrée, 15 $ / 1M sortie.
Luna cible les tâches haute fréquence et faible latence : résumés, brouillons et automatisation routinière. Luna est aussi le premier modèle non-flagship d’OpenAI à obtenir une note High en cybersécurité et en biologie. Tarifs : 1 $ / 1M entrée, 6 $ / 1M sortie.
GPT-5.6 est la première gamme OpenAI où les trois niveaux ont déclenché la classification High en risque cybersécurité.
TerminalBench 2.1 comprend 89 problèmes complexes de planification en ligne de commande, testant l’usage multi-outils, la réparation itérative et la coordination de tâches dans des contextes agent réalistes.
| Modèle | Score | Mode |
|---|---|---|
| GPT-5.6 Sol | 91,9 % | Ultra (multi-agents) |
| GPT-5.6 Sol | 88,8 % | Standard |
| Claude Mythos 5 | 88,0 % | Standard |
| GPT-5.5 | 83,4 % | Standard |
| Gemini 3.1 Pro Preview | 70,7 % | Standard |
Sol a détrôné Claude Mythos 5 après seulement 17 jours en tête — Mythos 5 avait pris la #1 le 9 juin.
| Modèle | Taux d’achèvement (mode code) |
|---|---|
| GPT-5.6 Sol | 50,9 % (seul modèle au-dessus de 50 %) |
| GPT-5.6 Luna | Légèrement au-dessus de GPT-5.5 |
| Modèle | Taux de réussite CTF |
|---|---|
| Sol | 96,7 % |
| Terra | 91,84 % |
| Luna | 85,19 % |
ExploitBench : Sol égale le Mythos Preview d’Anthropic sur ExploitBench en n’utilisant qu’environ un tiers des tokens de sortie, réduisant fortement le coût de recherche sécurité en entreprise.
Note sécurité : Les tests OpenAI montrent que Sol peut identifier des vulnérabilités et des primitives d’exploit dans les codebases Chromium et Firefox, mais ne peut pas construire autonomement des chaînes d’exploit complètes et fonctionnelles. Il reste sous le seuil « Cyber Critical » d’OpenAI.
À partir de juillet, GPT-5.6 Sol sera déployé sur le matériel Cerebras pour certains clients entreprise, atteignant jusqu’à 750 tokens par seconde.
Pour contexte, la plupart des modèles frontier sortent aujourd’hui entre 50 et 150 tokens par seconde. À 750 token/s, le temps de réponse pourrait chuter à un cinquième ou un quinzième de la latence actuelle — un changement significatif pour les assistants de code temps réel et les applications IA en streaming.
L’ordre exécutif accorde aux agences américaines jusqu’à 30 jours d’accès préalable pour examiner les modèles IA frontier au titre de la sécurité nationale. Il n’est pas juridiquement contraignant, mais a produit de vraies contraintes sur le calendrier de lancement.
| Entreprise | Modèle | Statut |
|---|---|---|
| OpenAI | GPT-5.6 Sol / Terra / Luna | Preview limitée (~20 org. partenaires) |
| Anthropic | Claude Fable 5 / Mythos 5 | Hors ligne le 12 juin (contrôle des exportations) |
| Gemini 3.5 Pro | Reporté à juillet (initialement juin) |
Juin 2026 devait être le plus grand mois de l’histoire de l’IA. À la place, les trois sorties flagship ont été stoppées à la porte.
| Dimension | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91,9 % (Ultra) / 88,8 % | 88,0 % |
| ExploitBench | Quasi identique au Mythos Preview, ~1/3 tokens | Données non publiques |
| Prix entrée | 5 $ / M | 10 $ / M (actuellement hors ligne) |
| Disponibilité | Preview limitée, sortie générale sous quelques semaines | Hors ligne (contrôle des exportations) |
| Fenêtre de contexte | ~1,5 M tokens | 200K tokens |
En bref : Sol mène sur TerminalBench et offre une capacité de recherche sécurité comparable à moitié prix en entrée. Claude Fable 5 peut encore mener sur SWE-Bench Pro ; la system card complète de GPT-5.6 clarifiera le tableau une fois publiée.
Maintenant (juin 2026) : Environ 20 partenaires de confiance vérifiés par le gouvernement via API et Codex uniquement ; les utilisateurs ChatGPT n’ont pas encore accès à GPT-5.6
Juillet 2026 attendu : Disponibilité générale ChatGPT (Plus et Pro en premier), accès API public
Sol Cerebras : Déploiement entreprise jusqu’à 750 token/s
Prévision Polymarket : Les traders attribuent environ 87 % de probabilité à une sortie large de GPT-5.6 avant le 31 juillet 2026
System card complète : Rapport de benchmarks complet attendu à la sortie générale
| Votre besoin | Modèle recommandé |
|---|---|
| Génération de code complexe, débogage, tâches agent multi-étapes | Sol |
| Analyse documentaire entreprise, support, appels API à volume | Terra |
| Résumés, brouillons, automatisation routinière | Luna |
| Capacité flagship avec budget serré | Terra (niveau GPT-5.5, 50 % moins cher) |
| Apps temps réel sensibles à la latence (après juillet) | Sol sur Cerebras |
GPT-5.6 incarne les progrès d’OpenAI sur trois dimensions :
Capacité : Le mode Ultra multi-agents de Sol domine le classement mondial du code, mettant fin au règne de 17 jours de Claude Mythos 5
Efficacité : Performance de recherche sécurité comparable à environ un tiers du coût en tokens des concurrents
Vitesse : Le déploiement Cerebras à 750 token/s en juillet redéfinira les limites des applications IA temps réel
La sortie crée aussi un précédent : le gouvernement américain est intervenu formellement pour la première fois dans un lancement de modèle frontier. L’équilibre entre sécurité nationale et accès ouvert façonnera la diffusion des modèles IA pour les années à venir.
Comme les trois niveaux GPT-5.6 ont franchi la classification High en cybersécurité, la sûreté a été au cœur de l’ingénierie :
Le red-teaming a confirmé que Sol ne peut pas concevoir autonomement une chaîne d’exploit complète et fonctionnelle contre des cibles réelles durcies. La Deployment Safety System Card d’OpenAI documente la méthodologie d’évaluation complète.
Tour d’horizon du renseignement pré-sortie en juin 2026.
Lire →Cursor, Claude Code, Copilot et Gemini — guide d’achat.
Lire →Silicium d’inférence sur mesure et course aux coûts face à Nvidia.
Lire →Pas encore pour le grand public. Actuellement limité à environ 20 organisations partenaires de confiance via API et Codex. Déploiement ChatGPT complet attendu sous quelques semaines, utilisateurs Plus et Pro en premier (juillet 2026).
Sol mène TerminalBench 2.1 à 91,9 % contre Claude Mythos 5 à 88,0 %. Claude Fable 5 mène sur SWE-Bench Pro, mais les scores SWE-Bench officiels de GPT-5.6 ne sont pas encore publiés. Sol offre le meilleur rapport qualité-prix — performances comparables ou supérieures à moindre coût.
Le mode Ultra déploie plusieurs sous-agents IA en parallèle sur différentes parties d’une tâche, puis synthétise un résultat unifié. Il améliore nettement les performances sur les tâches complexes mais consomme beaucoup plus de tokens — à réserver aux workflows agent vraiment difficiles.
Le gouvernement américain, via la Maison Blanche, l’OSTP et l’ONCD, a demandé à OpenAI de limiter l’accès pendant une revue de sécurité suite à l’ordre exécutif du 2 juin du président Trump. OpenAI a obéi mais s’est opposé à une pratique permanente.
Jusqu’à 750 tokens par seconde — environ 5 à 15 fois plus rapide que la plupart des modèles frontier actuels (50 à 150 token/s). Lancement juillet 2026 pour certains clients entreprise, quand Cerebras étendra sa capacité.
Environ 1,5 million de tokens, contre 1 million pour GPT-5.5. Confirmation officielle attendue avec la publication complète de la system card.
Les trois portent la classification High d’OpenAI en cybersécurité — capacité nettement accrue en recherche de vulnérabilités. OpenAI a mis en place des garde-fous en couches dont des classificateurs en temps réel et du red-teaming, et a confirmé que les modèles ne peuvent pas construire autonomement des exploits fonctionnels complets.
L’architecture Ultra multi-agents de GPT-5.6 Sol et son score de 91,9 % à TerminalBench signalent un nouveau palier de capacité pour Codex, OpenClaw et autres workflows agent. Pendant la fenêtre de preview gouvernementale, la plupart des développeurs ne peuvent pas encore valider pleinement les intégrations qui dépendent de Keychain, Xcode et du débogage GUI alignés sur l’écosystème Apple depuis une machine principale Windows ou Linux.
Louer un Mac distant évite amortissement, politiques de veille et risques de mise à jour OS sur du matériel possédé, tout en gardant clés API et dépôts sous votre contrôle. Vous travaillez sur un bureau macOS proche de la production pour lancer les intégrations Codex GPT-5.6 et les tests d’acceptation agent dès l’ouverture de l’accès. Pour préparer avant la sortie générale : consultez les offres VNCMac via la page tarifs Mac distant ou le bouton ci-dessous.
Sources : annonce officielle OpenAI, Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes. Données au 27 juin 2026.