기업·모델 이중 랭킹 · 미국 70%→30% · 품질 대 볼륨 · 유스케이스 매트릭스 · Q3 전망
Mac에서 Claude Code, OpenClaw, Cursor를 연결해 두었는데 모델 선택이 작년 벤치마크 시즌에 머물러 있다면, 2026년 6월 OpenRouter에서 실제로 소비되는 토큰이 청구서에 가장 가까운 신호입니다.핵심: OpenRouter Rankings 기준 중국계 모델이 개발자 트래픽 61%를 넘겼고, 미국 3사(Google·OpenAI·Anthropic 합산)는 12개월 만에 약 70%에서 30%로 하락했습니다. DeepSeek이 기업별 5.13T 주간(17.6%) 1위, DeepSeek V4 Flash가 모델별 619B 일간 1위입니다. 본문 구성: 6월 기업·모델 이중 랭킹, 미국 점유율 급락의 경제학, 품질 상한과 볼륨 1위의 분리(Claude Opus 4.8 지수 61.4 유지), 중국 API가 루틴 작업을 잡는 3가지 구조적 이유, 8+ 시나리오 유스케이스 표, GPT-6·Opus 5·Gemini 4 등 Q3 전망, H2 2026 거시 5대 예측, 모델 비종속 6단계 Runbook, Mac 수용 요점. 6월 LLM 트렌드, 주간 토큰 랭킹, OpenClaw 멀티모델 라우팅과 함께 읽으면 보드 확인부터 프로덕션 라우트 배포까지 연결됩니다.
OpenRouter는 전 세계 개발자가 실제로 라우팅한 토큰을 집계합니다. 6월 스냅샷은 벤더 PR이 아니라 프로덕션 스코어보드입니다. 두 축으로 읽으세요: 주간 볼륨을 담당하는 기업과 매일 호출되는 SKU.
| 순위 | 기업 | 출처 | 주간 토큰 | 점유율 |
|---|---|---|---|---|
| 1 | DeepSeek | 중국 | 5.13T | 17.6% |
| 2 | Anthropic | 미국 | 4.34T | 14.8% |
| 3 | 미국 | 3.66T | 12.5% | |
| 4 | OpenAI | 미국 | 2.46T | 8.4% |
| 5 | Xiaomi | 중국 | 2.42T | 8.3% |
| 6 | MiniMax | 중국 | 2.37T | 8.1% |
| 7 | Tencent | 중국 | 2.36T | 8.1% |
| 8 | Qwen(Alibaba) | 중국 | 1.26T | 4.3% |
상위 8개 중 중국계만으로 식별 가능 볼륨의 약 46%를 차지하며, 전체 보드에서 중국계 모델 트래픽은 61%를 넘겼습니다.
| 순위 | 모델 | 기업 | 일간 토큰 |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
일간 Top 10 중 7개가 중국계 SKU입니다. Anthropic은 Claude 3종을 유지하고 있어, 프리미엄 모델이 프로덕션에서 사라진 것이 아니라 Flash급 볼륨에는 미치지 못한다는 해석이 타당합니다.
Bloomberg와 Exponential View가 OpenRouter 데이터로 그린 곡선은 분명합니다. 2025년 6월 미국 3사(Google + OpenAI + Anthropic)는 약 70%. 2026년 6월에는 약 30%. 사라진 40%p는 미국·유럽·인도를 포함한 전 세계 개발자가 중국 오픈웨이트·밸류 API로 옮긴 결과입니다.
국내 선호 이야기가 아니라 비용 구조 이야기입니다. 샌디에이고 개발자는 이렇게 말했습니다.
「Claude로 1시간 코딩하면 약 10달러. DeepSeek은 50센트 미만.」
모델 선택을 품질만으로 결정하면 다음 청구서에서 네 가지 통증이 드러납니다.
단일 벤더 락인: 모든 Agent 스텝을 하나의 프론티어 모델에 고정하면, Flash급으로 80~90% 품질로 처리 가능한 작업에도 Opus 단가를 계속 지불합니다.
벤치마크 지연: MMLU 헤드라인은 분기 업데이트, OpenRouter 점유율은 주간 변동. 지난 시즌 리더보드 기준 판단은 청구서와 어긋납니다.
Agent 볼륨 폭발: 프로그래밍 관련 트래픽은 2025년 초 약 11%에서 2026년 중반 50% 초과. 배치 Agent 루프는 단가 차이를 8~30배 증폭합니다.
컴플라이언스 사각지대: 엔터프라이즈 조달과 개인 개발자 라우팅은 다른 곡선입니다. 볼륨 점유율과 Fortune 500 채택률은 일치하지 않습니다.
많은 보도가 「누가 대량 호출되는가」와 「엄격한 eval에서 누가 이기는가」를 혼동합니다. 2026년 6월에는 두 답이 크게 갈립니다.
| 모델 | Intelligence Index | SWE-bench Pro | 비고 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 장문맥·Agent 리드 |
| GPT-5.5 | 59–60 | 63.1% | 에코시스템·툴 호출 강점 |
| Gemini 3.1 Pro | 57 | — | 최난도 추론 |
| Qwen 3.7 Max | 57 | — | 중국 클로즈드 상위 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | 라이팅·지시 따르기 |
한 엔지니어가 동일 20개 태스크를 프론티어 각사에서 실행한 결과, Opus 4.8이 16승, GPT-5.5 5승, Gemini 3.1 Pro 4승. 장문맥에서는 Opus가 「조금 위」가 아니라 다른 카테고리였습니다.
Claude Fable 5도 주목할 만합니다. SWE-bench Verified 약 95%를 포함한 100/100 품질 평가를 기록한 뒤, 2026년 6월 중순 수출 규제로 글로벌 라우팅에서 offline 되었습니다. 볼륨 랭킹은 변하지 않지만, 미국 측 품질 상한이 현재 라우팅 가능 모델을 넘을 수 있음을 보여줍니다.
가격: MiniMax M3 입력 $0.60/M, Claude Opus 4.8 $5.00/M. 고볼륨 스텝에서 약 8분의 1 비용.
충분한 품질: 코드 완성·번역·요약·일상 개발 지원에서 중국 밸류 티어가 프론티어 성능의 80~90% 제공.
오픈웨이트: DeepSeek V4, MiniMax M3는 가중치 공개. 자체 추론 스택을 가진 팀은 데이터 거주지(residency) 우려를 낮출 수 있습니다.
판단 규칙: 브랜드가 아니라 태스크 난이도로 분기. 최상위 5%는 프론티어, 나머지 95% 토큰은 중국 밸류 API.
| 시나리오 | 권장 모델 | 이유 |
|---|---|---|
| 복잡 코딩/장시간 Agent | Claude Opus 4.8 | Intelligence Index #1, 초장문맥 |
| 일상 개발 지원 | DeepSeek V4 Flash / MiMo-V2.5 | 가격 대 성능, 낮은 지연 |
| 최저 비용 프로덕션 API | MiniMax M3 | $0.60/M, 오픈웨이트, 셀프호스트 가능 |
| 초장문맥(100만+ 토큰) | Kimi K2.6 | 1M 컨텍스트, 경쟁력 있는 단가 |
| Google Workspace/멀티모달 | Gemini 3.5 Flash | Workspace 네이티브 통합, 속도·가성비 |
| 실시간 Web/X 컨텍스트 | Grok 4.3 | X/Twitter 라이브 정보 검색 |
| 셀프호스트/온프레 | GLM 5.2 / Kimi K2.6 | 코딩에 강한 오픈웨이트 |
| 이미지 생성(읽을 수 있는 텍스트) | ChatGPT Images 2.0 | AI 생성 이미지 텍스트 렌더링 |
| 종합 데일리 채팅 | GPT-5.5 | GPT-5.3 대비 52.5% 적은 hallucination |
| 모델 | 기업 | 예상 시기 | 주요 업그레이드 |
|---|---|---|---|
| GPT-6 | OpenAI | 2026년 8~9월 | 150만 컨텍스트, Agent 강화 |
| Claude Opus 5 | Anthropic | 2026년 9월경 | 장기 Agent, MCP 갱신 |
| Gemini 4 | Q3 2026 | 영상·음성·이미지 생성 멀티모달 도약 | |
| DeepSeek V5 | DeepSeek | Q3 2026 | 오픈웨이트, 약 1T 파라미터, Ascend 스택 |
| GLM 5.2 | Zhipu AI | Q3 2026 | 코딩·추론 오픈웨이트 강화 |
| Grok 4.3+ | xAI | Q3 2026 | 1M 컨텍스트, 실시간 Web 강화 |
「최강 모델」 지표 실효: 90일에 프론티어급 5종 출시 시 랭킹은 워크로드별로 분화. 복잡도·지연·비용으로 전환하는 라우팅 계층 필수.
중국 볼륨은 상승, 엔터프라이즈는 컴플라이언스가 천장: 개인 개발자는 OpenRouter 중국 점유율 70%+ 가능, Fortune 500은 데이터 거주·미 의회 감시로 상한.
Agent 성능이 엔터프라이즈 KPI: Anthropic 2026 State of AI Agents 보고서에서 Claude API 사용 44%가 수학·컴퓨터 태스크.
IPO 압력이 가격 재편: OpenAI·Anthropic 2026년 6월 IPO 의향. 상장 후 마진 압력이 tier 분리 가속, 비용 민감 작업은 최저가 API로.
로컬 모델, consumer GPU에서 SWE-bench 80% 접근: 32GB급 GPU가 2027년 중반 SWE-bench Verified 약 80% 도달 전망.
보드 베이스라인: openrouter.ai/rankings 주간 스냅샷, 점유율 델타 기록.
워크로드 tier 태깅: frontier vs routine. frontier는 Opus 4.8/GPT-5.5, routine은 DeepSeek V4 Flash/MiniMax M3.
예산·폴백: OpenClaw/Claude Code에서 경로별 토큰 상한, 일일 지출, 429/타임아웃 폴백.
20태스크 프로브: 동일 프롬프트로 승패 분포 측정.
성과당 달러: PR·티켓·Agent 1회당 비용 추적.
원격 Mac VNC 수용: Agent 호스트 GUI에서 Gateway·OAuth·Keychain 완료.
{
"routing_tiers": {
"frontier": ["anthropic/claude-opus-4.8", "openai/gpt-5.5"],
"routine": ["deepseek/deepseek-v4-flash", "minimax/minimax-m3"]
},
"budgets": { "daily_usd_cap": 25, "fallback_on_429": true },
"review_cadence": "weekly_openrouter_snapshot"
}
오늘의 볼륨 1위가 내일의 품질 상한은 아닙니다. 앱 재작성 없이 교체 가능한 라우트를 설계하세요.
7일 롤링 볼륨, Anthropic 프리미엄 패러독스.
읽기 →Top 10, 6대 트렌드, Mac Agent 결정표.
읽기 →openclaw models, 비용 상한, VNC 검수.
읽기 →아닙니다. 토큰 볼륨은 프로덕션 라우팅 경제성을 반영합니다. Claude Opus 4.8은 Index 61.4 1위. 고볼륨 루틴은 중국 밸류, 최상위 5%는 미국 프론티어. 03절 참조.
전 세계 개발자가 백만 토큰당 8~30배 저렴한 중국 API로 Agent 배치를 옮겼습니다. 일상 코딩·요약에서 80~90% 품질 유지. 비용 구조 변화입니다.
Claude Opus 4.8이 장시간 Agent·초장문맥 상한. 루틴은 DeepSeek V4 Flash/MiniMax M3. 04절 유스케이스 9시나리오.
OpenClaw/Claude Code 예산·폴백 정의 후 원격 Mac VNC로 Gateway·OAuth 수용. 06절 Runbook·멀티모델 검수 참조.
2026년 6월의 구조적 이야기는 「중국이 이겼다」가 아닙니다. 모델 계층의 경제 마진이 압축되고 있다는 이야기입니다. DeepSeek 2025년 1월 출시는 프론티어급 성능에 프론티어급 컴퓨트가 필수가 아님을 증명했고, Xiaomi·Tencent·MiniMax·Moonshot이 같은 플레이북으로 베이스 가격을 바닥으로 밀어냈습니다.
미국 3사는 분기합니다. OpenAI는 에코시스템 깊이, Anthropic은 Opus 품질 상한, Google은 Gemini Flash 속도·멀티모달. Claude급도 아니고 충분히 싸지도 않은 중간 tier가 가장 빨리 공동화됩니다.
Mac 개발자의 숨은 비용은 API 단가만이 아닙니다. 닫힌 노트북이 Gateway를 죽이고, Keychain이 headless SSH를 막고, Q3 3모델 A/B에 실화면 OAuth가 필요합니다. VNCMac는 멀티모델 Agent 라우팅용 물리 Mac mini를 월 임대합니다. 요금, 홈에서 확인하세요.