TerminalBench 91.9% · CTF 96.7% · 정부 한정 프리뷰 · Cerebras 750 token/s
2026년 6월 26일, OpenAI는 GPT-5.6 패밀리——플래그십 Sol, 균형형 Terra, 경량 Luna——를 공개하며 첫 태양계 명명 체계를 도입했습니다. Sol은 TerminalBench 2.1에서 91.9%, 사이버보안 CTF 평가에서 96.7%를 기록했습니다. 세 모델 모두 OpenAI 사이버보안 High 임계값을 넘었습니다. 미국 정부 보안 심사로 현재 접근 가능한 곳은 심사된 파트너 약 20곳으로 제한됩니다. 본문은 가격·포지셔닝, 주요 벤치마크, Cerebras 가속, 6월 정책 파장, Claude Mythos 5 비교, 접근 일정, 용도별 추천, 안전 아키텍처, FAQ까지 정리합니다.
| 모델 | 포지션 | 입력 가격 | 출력 가격 | 하이라이트 |
|---|---|---|---|---|
| GPT-5.6 Sol | 플래그십 / 최대 성능 | $5 / 100만 토큰 | $30 / 100만 토큰 | TerminalBench 2.1 1위(91.9%) |
| GPT-5.6 Terra | 균형 / 주력 | $2.50 / 100만 토큰 | $15 / 100만 토큰 | GPT-5.5급, 비용 50% 절감 |
| GPT-5.6 Luna | 경량 / 고속 | $1 / 100만 토큰 | $6 / 100만 토큰 | 고빈도 작업, Sol 대비 80% 저렴 |
현황: 미국 정부 요청에 따라 GPT-5.6은 심사 파트너 약 20곳에 한정 공개 중입니다. 수 주 내 일반 제공이 예상됩니다. 컨텍스트 윈도는 약 150만 토큰(System Card 정식판에서 확정 예정).
OpenAI는 2026년 6월 26일 새로운 천체 명명으로 GPT-5.6을 출시했습니다. Sol(태양)이 플래그십, Terra(지구)가 균형층, Luna(달)이 경량층에 해당합니다.
다만 전개는 순탄치 않았습니다. 트럼프 대통령의 6월 2일 행정명령 이후 백악관은 과학기술정책국(OSTP)과 국가사이버국(ONCD)을 조율해 광범위 공개 전 정부 보안 심사를 요구했습니다. 이는 미국 정부가 프론티어 모델 공개를 공식 제한한 최초 사례입니다. CEO 샘 알트먼은 협조 의사를 밝히면서도 다음과 같이 공언했습니다.
「이런 종류의 정부 접근 절차가 장기적 기본값이 되어서는 안 된다고 봅니다. 최고의 도구가 이를 필요로 하는 사용자, 개발자, 기업, 사이버 방어자, 글로벌 파트너에게서 멀어지기 때문입니다.」
대다수 사용자와 기업은 ChatGPT나 공개 API로 GPT-5.6을 아직 쓸 수 없습니다
6월은 「슈퍼 런치의 달」이었지만 OpenAI·Anthropic·Google 플래그십이 모두 차단 또는 연기되었습니다
한정 프리뷰로 Agent 워크플로·Codex 연동·벤치마크 재현은 7월까지 수 주 기다려야 할 수 있습니다
정책 불확실성이 모델 선정과 예산 계획에 숨은 비용을 더합니다
접근 개방과 동시에 새 모델을 검증할 macOS 개발 환경을 미리 갖춰 두어야 합니다
Sol은 OpenAI 역사상 가장 강력한 모델로, 고난도 프로그래밍, 장기 사이버보안 연구, 다단계 에이전트 워크플로를 위해 설계되었습니다.
두 가지 신규 추론 모드:
가격: 입력 $5 / 100만 토큰, 출력 $30 / 100만 토큰(GPT-5.5와 동일)
Terra는 대규모 고객 지원, 사내 도구, 문서 분석용 엔터프라이즈 주력입니다. GPT-5.5에 가까운 성능을 50% 낮은 비용으로 제공해 대규모 배포 시 가성비가 가장 높습니다. 가격: 입력 $2.50 / 100만, 출력 $15 / 100만.
Luna는 요약, 초안 작성, 일상 자동화 등 고빈도·저지연 작업에 맞춰졌습니다. 비플래그십 모델로는 처음으로 사이버보안과 생물학 모두에서 High 등급을 받았습니다. 가격: 입력 $1 / 100만, 출력 $6 / 100만.
GPT-5.6은 세 티어 모두 OpenAI 사이버보안 High 위험 분류를 트리거한 최초 제품 라인입니다.
TerminalBench 2.1은 89개의 복잡한 커맨드라인 계획 문제로, 현실적 에이전트 환경에서 다단계 도구 사용, 반복 수정, 작업 조율을 측정합니다.
| 모델 | 점수 | 모드 |
|---|---|---|
| GPT-5.6 Sol | 91.9% | Ultra(멀티에이전트) |
| GPT-5.6 Sol | 88.8% | 표준 |
| Claude Mythos 5 | 88.0% | 표준 |
| GPT-5.5 | 83.4% | 표준 |
| Gemini 3.1 Pro Preview | 70.7% | 표준 |
Sol은 Claude Mythos 5의 1위를 단 17일 만에 넘겼습니다. Mythos 5는 6월 9일에 정상에 올랐습니다.
| 모델 | 작업 완료율(코드 모드) |
|---|---|
| GPT-5.6 Sol | 50.9%(50% 초과는 Sol만) |
| GPT-5.6 Luna | GPT-5.5를 약간 상회 |
| 모델 | CTF 적중률 |
|---|---|
| Sol | 96.7% |
| Terra | 91.84% |
| Luna | 85.19% |
ExploitBench: Sol은 Anthropic Mythos Preview와 거의 동등한 성능을 출력 토큰 약 3분의 1로 달성해 기업 보안 연구 비용을 크게 줄입니다.
안전 참고: OpenAI 테스트에 따르면 Sol은 Chromium·Firefox 코드베이스의 취약점과 익스플로잇 프리미티브를 식별할 수 있지만, 완전하고 기능적인 익스플로잇 체인을 자율 구축할 수는 없습니다. 「Cyber Critical」 임계값에는 미달합니다.
7월부터 GPT-5.6 Sol은 선정 기업 고객을 위해 Cerebras 하드웨어에 배포되며 최대 750 token/s에 도달합니다.
참고로 현행 대부분 프론티어 모델은 50–150 token/s입니다. 750 token/s면 응답 시간이 현재의 5분의 1~15분의 1로 줄어들 수 있어, 실시간 코딩 어시스턴트와 스트리밍 AI 앱에 큰 변화를 가져옵니다.
행정명령은 미국 정부 기관이 프론티어 AI 모델 공개 전 최대 30일 접근으로 국가안보 심사를 할 수 있게 합니다. 법적 강제력은 없지만 실제 출시 제약을 만들었습니다.
| 회사 | 모델 | 상태 |
|---|---|---|
| OpenAI | GPT-5.6 Sol / Terra / Luna | 한정 프리뷰(파트너 약 20곳) |
| Anthropic | Claude Fable 5 / Mythos 5 | 6월 12일 수출 통제로 강제 오프라인 |
| Gemini 3.5 Pro | 7월로 연기(원래 6월) |
6월은 AI 역사상 가장 큰 런치의 달이 될 뻔했습니다. 그러나 세 곳의 플래그십은 모두 공개 문 앞에서 발목을 잡혔습니다.
| 관점 | GPT-5.6 Sol | Claude Mythos 5 |
|---|---|---|
| TerminalBench 2.1 | 91.9%(Ultra)/ 88.8% | 88.0% |
| ExploitBench | Mythos Preview와 유사, 토큰 약 1/3 | 데이터 비공개 |
| 입력 가격 | $5 / M | $10 / M(현재 오프라인) |
| 가용성 | 한정 프리뷰, 수 주 내 일반 공개 예상 | 수출 통제로 오프라인 |
| 컨텍스트 | 약 150만 토큰 | 20만 토큰 |
결론: Sol은 TerminalBench에서 앞서며 입력 가격은 절반으로 동급 보안 연구 능력을 제공합니다. Claude Fable 5는 SWE-Bench Pro 등 다른 차원에서 앞설 수 있습니다. GPT-5.6 전체 System Card 공개 후 그림이 더 선명해질 것입니다.
현재(2026년 6월): 정부 심사 신뢰 파트너 약 20곳만 API·Codex로 이용 가능. ChatGPT 사용자는 아직 접근 불가
7월 예상: ChatGPT 일반 공개(Plus·Pro 우선), 공개 API 접근
Cerebras Sol: 기업 대상 배포, 최대 750 token/s
Polymarket 예측: 2026년 7월 31일까지 GPT-5.6 광범위 공개 확률 약 87%
전체 System Card: 일반 공개 시 전체 벤치마크 보고서 공개 예상
| 니즈 | 추천 모델 |
|---|---|
| 복잡한 코드 생성, 디버깅, 다단계 에이전트 작업 | Sol |
| 기업 문서 분석, 지원, 대규모 API 호출 | Terra |
| 요약, 초안, 일상 자동화 | Luna |
| 제한된 예산으로 플래그십급 능력 필요 | Terra(GPT-5.5급, 비용 50% 절감) |
| 지연 민감 실시간 앱(7월 이후) | Cerebras Sol |
GPT-5.6은 OpenAI의 세 차원 진보를 보여 줍니다.
능력: Sol의 Ultra 멀티에이전트가 세계 코딩 리더보드 1위를 차지하며 Claude Mythos 5의 17일간 정상을 끝냈습니다
효율: 동급 보안 연구 성능을 경쟁사 대비 약 3분의 1 토큰 비용으로 달성
속도: 7월 Cerebras 750 token/s 배포가 실시간 AI 앱의 경계를 바꿉니다
이번 공개는 선례도 만들었습니다. 미국 정부가 프론티어 모델 출시에 공식 개입한 최초 사례입니다. 국가안보와 개방 접근의 균형이 앞으로 수년간 AI 공개 방식을 좌우할 것입니다.
세 티어 모두 OpenAI 사이버보안 High 분류를 넘었기에 안전성이 핵심 설계 초점이었습니다.
레드팀 결과 Sol은 견고한 실전 타깃에 대해 완전하고 기능적인 익스플로잇 체인을 자율 구축할 수 없음이 확인되었습니다. OpenAI Deployment Safety System Card에 평가 방법 전문이 기록되어 있습니다.
2026년 6월 공개 전 인텔리전스 정리.
읽기 →Cursor, Claude Code, Copilot, Gemini 선택 가이드.
읽기 →맞춤 추론 실리콘과 Nvidia 비용 경쟁.
읽기 →일반 사용자는 아직 불가합니다. 현재 신뢰 파트너 약 20곳만 API와 Codex로 접근할 수 있습니다. 수 주 내 ChatGPT 전면 공개가 예상되며 Plus·Pro 사용자가 우선됩니다(2026년 7월).
TerminalBench 2.1에서 Sol은 91.9%, Claude Mythos 5는 88.0%입니다. Claude Fable 5는 SWE-Bench Pro에서 앞서지만 GPT-5.6 SWE-Bench 공식 점수는 미공개입니다. Sol은 더 저렴한 가격으로 동급 이상 성능이 기대됩니다.
Ultra 모드는 여러 AI 서브에이전트가 작업의 각 부분을 병렬 처리한 뒤 통합 결과를 생성합니다. 복잡 작업 성능을 크게 높이지만 토큰 소비도 대폭 증가합니다. 정말 어려운 에이전트 워크플로에 적합합니다.
미국 정부(백악관, OSTP, ONCD)가 트럼프 대통령 6월 2일 행정명령에 따른 보안 심사 기간 중 접근 제한을 요청했습니다. OpenAI는 협조하되 이 관행의 상시화에 반대 입장을 밝혔습니다.
최대 750 token/s——대부분 현행 프론티어 모델(50–150 token/s)의 약 5–15배입니다. 2026년 7월부터 Cerebras 용량 확대와 함께 선정 기업 고객 대상 배포 예정입니다.
약 150만 토큰으로 보도되며 GPT-5.5의 100만 토큰에서 확대되었습니다. 전체 System Card 공개 시 공식 확인될 예정입니다.
세 모델 모두 OpenAI 사이버보안 High 위험 등급을 받았으며 취약점 연구 능력이 크게 높아졌습니다. 실시간 분류기와 레드팀 등 다층 방어가 적용되었고, 완전한 기능적 익스플로잇을 자율 구축할 수 없음이 확인되었습니다.
GPT-5.6 Sol의 Ultra 멀티에이전트 방식과 TerminalBench 91.9%는 Codex, OpenClaw 등 에이전트 워크플로에 새로운 능력 단계를 가져옵니다. 정부 한정 프리뷰 기간에는 대다수 개발자가 Windows/Linux 중심 환경에서 Keychain·Xcode·GUI 디버깅 등 Apple 생태계에 맞춘 통합을 완전히 검증할 수 없습니다.
원격 Mac 임대는 자체 하드웨어 감가상각·슬립 정책·OS 업데이트 위험을 피하면서 API 키와 저장소는 본인 관리 아래 둘 수 있습니다. 프로덕션에 가까운 macOS 데스크톱에서 GPT-5.6 Codex 연동과 에이전트 인수 테스트를 접근 개방과 동시에 돌릴 수 있습니다. 일반 공개 전 준비하려면 VNCMac 요금 플랜을 확인하세요. 아래 주 버튼에서도 이동할 수 있습니다.
출처: OpenAI 공식 발표, Deployment Safety System Card, VentureBeat, SiliconAngle, TechTimes. 데이터 기준 2026년 6월 27일.