TerminalBench 91,9 % · CTF 96,7 % · правительственный preview · Cerebras 750 токен/с
26 июня 2026 года OpenAI представила семейство GPT-5.6 — флагман Sol, сбалансированный Terra и облегчённый Luna — с первой в истории компании космической номенклатурой. Sol лидирует в TerminalBench 2.1 с 91,9 % и достигает 96,7 % в CTF-тестах по кибербезопасности. Все три модели пересекли порог High OpenAI в кибербезопасности. Из-за проверки безопасности правительством США сегодня доступ имеют лишь около 20 проверенных партнёрских организаций. В этом руководстве — цены и позиционирование, все ключевые бенчмарки, ускорение Cerebras, политические последствия июня, сравнение с Claude Mythos 5, сроки доступа, сценарии использования, архитектура безопасности и FAQ.
| Модель | Позиционирование | Цена входа | Цена выхода | Главное |
|---|---|---|---|---|
| GPT-5.6 Sol | Флагман / максимальные возможности | 5 $ / 1M токенов | 30 $ / 1M токенов | TerminalBench 2.1 #1 (91,9 %) |
| GPT-5.6 Terra | Сбалансированная / рабочая лошадка | 2,50 $ / 1M токенов | 15 $ / 1M токенов | Близко к GPT-5.5, на 50 % дешевле |
| GPT-5.6 Luna | Облегчённая / быстрая | 1 $ / 1M токенов | 6 $ / 1M токенов | Массовые задачи, на 80 % дешевле Sol |
Текущий статус: По запросу правительства США GPT-5.6 ограничен примерно 20 одобренными партнёрскими организациями. Широкая доступность ожидается в течение нескольких недель. Контекстное окно сообщается около 1,5 млн токенов (официальное подтверждение с полной system card в ожидании).
OpenAI запустила GPT-5.6 26 июня 2026 года с новой системой имён по небесным телам: Sol (Солнце) — флагман, Terra (Земля) — средний уровень, Luna (Луна) — облегчённый tier.
Запуск прошёл не гладко. После исполнительного указа от 2 июня президента Трампа Белый дом скоординировал OSTP и ONCD, чтобы потребовать правительственную проверку безопасности до широкого релиза. Это впервые, когда правительство США формально потребовало от ИИ-компании ограничить запуск frontier-модели. CEO Сэм Альтман заявил о сотрудничестве, но публично возразил:
«Мы не считаем, что такой процесс государственного доступа должен стать долгосрочной нормой. Он лишает пользователей, разработчиков, предприятий, защитников киберпространства и глобальных партнёров лучших инструментов, которые им нужны.»
Большинство пользователей и компаний ещё не могут получить GPT-5.6 через ChatGPT или публичный API
Июнь 2026 должен был стать «супер-месяцем релизов», но OpenAI, Anthropic и Google все столкнулись с блокировкой или задержкой флагманов
Ограниченный preview означает: agent-воркфлоу, интеграция Codex и воспроизведение бенчмарков могут ждать недели до июля
Политическая неопределённость добавляет скрытые издержки к выбору модели и планированию бюджета
Командам стоит подготовить macOS-среду разработки, чтобы проверить возможности модели сразу при открытии доступа
Sol — самая мощная модель OpenAI на сегодня, созданная для сложного программирования, долгосрочных исследований в кибербезопасности и многошаговых agentic-воркфлоу.
Два новых режима рассуждения:
Цены: 5 $ / 1M входных токенов, 30 $ / 1M выходных (как у GPT-5.5)
Terra — корпоративная рабочая лошадка для массовой поддержки клиентов, внутренних инструментов и анализа документов. Производительность близка к GPT-5.5 при на 50 % меньших затратах — лучшее соотношение цены и качества для масштабного развёртывания. Цены: 2,50 $ / 1M вход, 15 $ / 1M выход.
Luna ориентирована на высокочастотные задачи с низкой латентностью: суммаризация, черновики и рутинная автоматизация. Luna — также первая не-флагманская модель OpenAI с рейтингом High и в кибербезопасности, и в биологии. Цены: 1 $ / 1M вход, 6 $ / 1M выход.
GPT-5.6 — первая линейка OpenAI, где все три уровня вызвали классификацию High по риску кибербезопасности.
TerminalBench 2.1 включает 89 сложных задач планирования в командной строке, тестируя многошаговое использование инструментов, итеративное исправление и координацию задач в реалистичных agent-сценариях.
| Модель | Результат | Режим |
|---|---|---|
| GPT-5.6 Sol | 91,9 % | Ultra (мультиагент) |
| GPT-5.6 Sol | 88,8 % | Стандартный |
| Claude Mythos 5 | 88,0 % | Стандартный |
| GPT-5.5 | 83,4 % | Стандартный |
| Gemini 3.1 Pro Preview | 70,7 % | Стандартный |
Sol сместил Claude Mythos 5 с первого места всего за 17 дней — Mythos 5 занял #1 9 июня.
| Модель | Доля завершённых задач (режим кода) |
|---|---|
| GPT-5.6 Sol | 50,9 % (единственная модель выше 50 %) |
| GPT-5.6 Luna | Немного выше GPT-5.5 |
| Модель | Успешность CTF |
|---|---|
| Sol | 96,7 % |
| Terra | 91,84 % |
| Luna | 85,19 % |
ExploitBench: Sol сопоставим с Mythos Preview от Anthropic на ExploitBench, используя лишь около трети выходных токенов, что резко снижает стоимость корпоративных исследований безопасности.
Замечание по безопасности: Тесты OpenAI показывают, что Sol может выявлять уязвимости и примитивы эксплойтов в кодовых базах Chromium и Firefox, но не может автономно конструировать полные функциональные цепочки эксплойтов. Он остаётся ниже порога «Cyber Critical» OpenAI.
С июля GPT-5.6 Sol будет развёрнут на оборудовании Cerebras для избранных корпоративных клиентов, достигая до 750 токенов в секунду.
Для сравнения: большинство frontier-моделей сегодня выдают между 50 и 150 токенами в секунду. При 750 токен/с время ответа может сократиться до одной пятой или одной пятнадцатой текущей латентности — значимый сдвиг для ассистентов кода в реальном времени и streaming-приложений ИИ.
Указ предоставляет агентствам США до 30 дней предрелизного доступа для проверки frontier-моделей ИИ в интересах национальной безопасности. Он не является юридически обязательным, но создал реальные ограничения на сроки запуска.
| Компания | Модель | Статус |
|---|---|---|
| OpenAI | GPT-5.6 Sol / Terra / Luna | Ограниченный preview (~20 партнёрских орг.) |
| Anthropic | Claude Fable 5 / Mythos 5 | Отключены 12 июня (экспортный контроль) |
| Gemini 3.5 Pro | Отложен на июль (изначально июнь) |
Июнь 2026 должен был стать крупнейшим месяцем в истории ИИ. Вместо этого все три флагманских релиза были остановлены у порога.
| Параметр | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91,9 % (Ultra) / 88,8 % | 88,0 % |
| ExploitBench | Почти идентично Mythos Preview, ~1/3 токенов | Данные не публичны |
| Цена входа | 5 $ / M | 10 $ / M (сейчас offline) |
| Доступность | Ограниченный preview, широкий релиз через недели | Offline из-за экспортного контроля |
| Контекстное окно | ~1,5 млн токенов | 200K токенов |
Итог: Sol лидирует в TerminalBench и даёт сопоставимые возможности для исследований безопасности при вдвое меньшей цене входа. Claude Fable 5 может ещё лидировать в SWE-Bench Pro; полная system card GPT-5.6 прояснит картину после публикации.
Сейчас (июнь 2026): Около 20 проверенных правительством партнёров только через API и Codex; пользователи ChatGPT пока не имеют доступа к GPT-5.6
Ожидается июль 2026: Общая доступность ChatGPT (сначала Plus и Pro), публичный API
Sol на Cerebras: Корпоративное развёртывание до 750 токен/с
Прогноз Polymarket: Трейдеры оценивают вероятность широкого релиза GPT-5.6 до 31 июля 2026 примерно в 87 %
Полная system card: Полный отчёт по бенчмаркам ожидается при общем релизе
| Ваша задача | Рекомендуемая модель |
|---|---|
| Сложная генерация кода, отладка, многошаговые agent-задачи | Sol |
| Корпоративный анализ документов, поддержка, массовые API-вызовы | Terra |
| Суммаризация, черновики, рутинная автоматизация | Luna |
| Флагманские возможности при ограниченном бюджете | Terra (уровень GPT-5.5, на 50 % дешевле) |
| Приложения с критичной латентностью (после июля) | Sol на Cerebras |
GPT-5.6 отражает прогресс OpenAI в трёх измерениях:
Возможности: Ultra-мультиагентный режим Sol возглавляет мировой рейтинг по коду, завершив 17-дневное правление Claude Mythos 5
Эффективность: Сопоставимая производительность в исследованиях безопасности примерно за треть стоимости токенов конкурентов
Скорость: Развёртывание Cerebras с 750 токен/с в июле изменит границы приложений ИИ в реальном времени
Релиз также создаёт прецедент: правительство США впервые формально вмешалось в запуск frontier-модели. Баланс между национальной безопасностью и открытым доступом будет определять, как модели ИИ выходят на рынок в ближайшие годы.
Поскольку все три уровня GPT-5.6 пересекли классификацию High по кибербезопасности, безопасность стала приоритетом инженерии:
Red-teaming подтвердил: Sol не может автономно разработать полную функциональную цепочку эксплойта против закалённых реальных целей. Deployment Safety System Card OpenAI документирует полную методологию оценки.
Сводка разведданных до релиза за июнь 2026.
Читать →Cursor, Claude Code, Copilot и Gemini — гид по выбору.
Читать →Кастомный inference-кремний и гонка затрат с Nvidia.
Читать →Пока нет для широкой публики. Сейчас доступ ограничен примерно 20 проверенными партнёрскими организациями через API и Codex. Полный запуск в ChatGPT ожидается в течение нескольких недель, сначала для пользователей Plus и Pro (июль 2026).
Sol лидирует в TerminalBench 2.1 с 91,9 % против Claude Mythos 5 с 88,0 %. Claude Fable 5 лидирует в SWE-Bench Pro, но официальные результаты GPT-5.6 по SWE-Bench ещё не опубликованы. Sol — лучшее соотношение цены и качества: сопоставимая или лучшая производительность по более низкой цене.
Режим Ultra разворачивает несколько ИИ-субагентов, которые параллельно работают над разными частями задачи, а затем синтезируют единый результат. Он значительно повышает производительность на сложных задачах, но потребляет намного больше токенов — лучше для действительно тяжёлых agent-воркфлоу.
Правительство США через Белый дом, OSTP и ONCD попросило OpenAI ограничить доступ на период проверки безопасности после исполнительного указа от 2 июня президента Трампа. OpenAI согласилась, но выступила против постоянной практики.
До 750 токенов в секунду — примерно в 5–15 раз быстрее большинства современных frontier-моделей (50–150 токен/с). Запуск в июле 2026 для избранных корпоративных клиентов по мере расширения мощностей Cerebras.
Сообщается около 1,5 миллиона токенов, против 1 миллиона у GPT-5.5. Официальное подтверждение ожидается с полной публикацией system card.
Все три несут рейтинг High по кибербезопасности от OpenAI — значительно повышенные возможности в исследовании уязвимостей. OpenAI внедрила многоуровневые защиты, включая классификаторы в реальном времени и red-teaming, и подтвердила: модели не могут автономно создавать полноценные функциональные эксплойты.
Ultra-мультиагентная архитектура GPT-5.6 Sol и результат 91,9 % в TerminalBench сигнализируют о новом уровне возможностей для Codex, OpenClaw и других agent-воркфлоу. В период правительственного preview большинство разработчиков ещё не могут полноценно проверить интеграции, зависящие от Keychain, Xcode и GUI-отладки в экосистеме Apple, с основной машины на Windows или Linux.
Аренда удалённого Mac избавляет от амортизации, политик сна и рисков обновления ОС на собственном железе, сохраняя API-ключи и репозитории под вашим контролем. Вы работаете на production-подобном macOS-рабочем столе, чтобы запускать интеграции Codex GPT-5.6 и acceptance-тесты агентов сразу при открытии доступа. Чтобы подготовиться до широкого релиза: тарифы VNCMac на странице аренды Mac или кнопка ниже.
Источники: официальное объявление OpenAI, Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes. Данные на 27 июня 2026.