企業・モデル双榜 · 米国 70%→30% · 品質対ボリューム · ユースケース表 · Q3 予測
Mac 上で Claude Code、OpenClaw、Cursor を配線しているのに、モデル選定が昨年のベンチマークシーズンのままなら、2026年6月に OpenRouter で実際に消費されているトークンこそが請求書に最も近いシグナルです。結論:OpenRouter Rankingsを基準に、中国系モデルは開発者トラフィックの 61% を超え、米国各社(Google・OpenAI・Anthropic 合算)は 12 か月で約 70% から 30% に低下しました。DeepSeek が企業別 5.13T 週次(17.6%)で首位、DeepSeek V4 Flash がモデル別 619B 日次でトップです。本稿の構成:6月の企業・モデル双榜、米国シェア急落の経済学、品質上限とボリューム王者の分離(Claude Opus 4.8 は指数 61.4 で依然 #1)、中国系 API が定常作業を獲る 3 つの構造理由、8 シナリオのユースケース表、GPT-6・Opus 5・Gemini 4 など Q3 予測、H2 2026 の 5 つのマクロトレンド、モデル非依存ルーティングの 6 段階 Runbook、Mac 受け入れの要点。6月 LLM トレンド解説、週次トークンランキング、OpenClaw マルチモデルルーティングと併読すると、ボード閲覧から本番ルート投入まで一気通貫で整理できます。
OpenRouter は世界中の開発者が実際にルーティングしたトークンを集計します。6月のスナップショットはベンダー PR ではなく、本番スコアボードです。読み方は二軸:週次ボリュームを担う企業と日次で呼ばれる SKU。
| 順位 | 企業 | 出身 | 週次トークン | シェア |
|---|---|---|---|---|
| 1 | DeepSeek | 中国 | 5.13T | 17.6% |
| 2 | Anthropic | 米国 | 4.34T | 14.8% |
| 3 | 米国 | 3.66T | 12.5% | |
| 4 | OpenAI | 米国 | 2.46T | 8.4% |
| 5 | Xiaomi | 中国 | 2.42T | 8.3% |
| 6 | MiniMax | 中国 | 2.37T | 8.1% |
| 7 | Tencent | 中国 | 2.36T | 8.1% |
| 8 | Qwen(Alibaba) | 中国 | 1.26T | 4.3% |
上位 8 社のうち中国系だけで特定可能なボリュームの約 46% を占め、ボード全体では中国系モデルトラフィックが 61% を超えました。
| 順位 | モデル | 企業 | 日次トークン |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
日次 Top 10 の 7 枠が中国系 SKU です。Anthropic は Claude 3 バリアントを維持しており、プレミアムモデルが本番から消えたわけではなく、Flash 級のボリュームには届いていない、という読み方が妥当です。
Bloomberg や Exponential View が OpenRouter データを基に描いた曲線は明快です。2025年6月、米国各社(Google + OpenAI + Anthropic 合算)は約 70%。2026年6月には約 30%。消えた 40 ポイントは、米国・欧州・インドを含む世界中の開発者が中国系オープンウェイト/バリュー層 API へ移した結果です。
これは国内選好の話ではなく、経済性の話です。サンディエゴの開発者はこう語りました。
「Claude で 1 時間コーディングすると約 10 ドル。DeepSeek なら 50 セント以下。」
モデル選定を品質だけで決めていると、次の請求書で 4 つの痛みが表面化します。
単一ベンダーロックイン:全 Agent ステップを 1 つのフロンティアモデルに固定すると、Flash 級で 80〜90% 品質で済む作業にも Opus 単価を払い続けます。
ベンチマークのラグ:MMLU ヘッドラインは四半期更新、OpenRouter シェアは週次で動きます。昨シーズンのリーダーボード基準の判断は請求書とズレます。
Agent ボリュームの爆発:プログラミング関連トラフィックは 2025 年初頭の約 11% から 2026 年中期の 50% 超へ。バッチ Agent ループは単価差を 8〜30 倍に増幅します。
コンプライアンスの盲点:エンタープライズ調達と個人開発者のルーティングは別曲線です。ボリュームシェアと Fortune 500 採用率は一致しません。
多くの報道は「誰が大量に呼ばれているか」と「厳しい eval で誰が勝つか」を混同します。2026年6月はこの二つが大きく乖離しています。
Artificial Analysis Intelligence Index(2026年5月後半)と SWE-bench Pro が品質側の物語を示します。
| モデル | Intelligence Index | SWE-bench Pro | 備考 |
|---|---|---|---|
| Claude Opus 4.8 | 61.4(#1) | 69.2% | 長コンテキスト・Agent でリード |
| GPT-5.5 | 59–60 | 63.1% | エコシステム・ツール呼び出しが強い |
| Gemini 3.1 Pro | 57 | — | 最難推論タスク |
| Qwen 3.7 Max | 57 | — | 中国系クローズドの上位 |
| Claude Sonnet 4.6 | — | 80.8%(Verified) | ライティング・指示追従 |
あるエンジニアが同一 20 タスクをフロンティア各社で走らせた結果、Opus 4.8 が 16 勝、GPT-5.5 が 5 勝、Gemini 3.1 Pro が 4 勝。長コンテキストでは Opus が「少し上」ではなく別カテゴリでした。
Claude Fable 5 も注目です。SWE-bench Verified で約 95% を含む 100/100 の品質評価を一時記録した後、2026年6月中旬の輸出規制によりグローバルルーティングから offline になりました。ボリューム榜は変わりませんが、米国側の品質上限が現行ルート可能モデルを上回り得ることを示しています。
価格:MiniMax M3 は入力 $0.60/M、Claude Opus 4.8 は $5.00/M。高ボリュームステップでは約 8 分の 1 のコストです。
十分な品質:コード補完・翻訳・要約・日常の開発支援では、中国系バリュー層がフロンティア性能の 80〜90% を提供します。
オープンウェイト:DeepSeek V4 や MiniMax M3 は重みを公開。自前推論スタックを持つチームはデータ residency の懸念を下げられます。
判断ルール:ブランドではなくタスク難易度で振り分けてください。最難関 5% はフロンティア、残り 95% のトークンは中国系バリュー層へ。
ルーティング設定ドキュメントにそのまま貼れる表です。汎用リーダーボードではなく、品質・コスト・コンプライアンスのどれがそのワークロードで勝つかを示します。
| シナリオ | 推奨モデル | 理由 |
|---|---|---|
| 複雑コーディング/長時間 Agent | Claude Opus 4.8 | Intelligence Index #1、超長コンテキスト |
| 日常の開発支援 | DeepSeek V4 Flash / MiMo-V2.5 | 価格対性能・低レイテンシ |
| 最低コストの本番 API | MiniMax M3 | $0.60/M、オープンウェイト、自前ホスト可 |
| 超長コンテキスト(100 万トークン超) | Kimi K2.6 | 1M コンテキスト、競争力ある単価 |
| Google Workspace/マルチモーダル | Gemini 3.5 Flash | Workspace ネイティブ統合、速度とコスパ |
| リアルタイム Web/X コンテキスト | Grok 4.3 | X/Twitter からのライブ情報取得 |
| セルフホスト/オンプレ | GLM 5.2 / Kimi K2.6 | コーディングに強いオープンウェイト |
| 画像生成(読めるテキスト) | ChatGPT Images 2.0 | AI 生成画像のテキスト描画品質 |
| 総合デイリーチャット | GPT-5.5 | GPT-5.3 比 52.5% 少ない hallucination、深いエコシステム |
Q3 2026 は AI 史上、最も密度の高いフロンティアリリース四半期になりつつあります。8 月中旬から 9 月下旬の 6 週間に 3 つのフラッグシップが集中する見込みです。
| モデル | 企業 | 予想窗口 | 主なアップグレード |
|---|---|---|---|
| GPT-6 | OpenAI | 2026年8〜9月 | 150 万コンテキスト噂、Agent 強化 |
| Claude Opus 5 | Anthropic | 2026年9月頃 | 長期間 Agent、MCP 刷新 |
| Gemini 4 | Q3 2026 | 動画・音声・画像生成のマルチモーダル飛躍 | |
| DeepSeek V5 | DeepSeek | Q3 2026 | オープンウェイト、約 1T パラメータ、Ascend スタック |
| GLM 5.2 | Zhipu AI | Q3 2026 | コーディング・推論のオープンウェイト強化 |
| Grok 4.3+ | xAI | Q3 2026 | 1M コンテキスト、リアルタイム Web 強化 |
「最強モデル」指標の失効:90 日で 5 つのフロンティア級が出荷されると、ランキングはワークロード別になります。複雑度・レイテンシ・コストで切り替えるルーティング層が必須です。
中国系ボリュームは上昇、エンタープライズはコンプライアンスが天井:個人開発者は OpenRouter 中国系シェアを 70% 超へ押し上げ得ますが、Fortune 500 はデータ residency と米議会の監視で頭打ちです。
Agent 性能がエンタープライズ KPI に:Anthropic の 2026 State of AI Agents 報告では Claude API 利用の 44% が数学・コンピュータタスク。SWE-bench Pro と長期間 Agent eval で負けるラボは enterprise 案件を失います。
IPO 圧力が価格を再編:OpenAI と Anthropic は 2026年6月に IPO 意向を示しました。上場後のマージン圧力が tier 分離を加速し、コスト敏感な作業は最安 API へ流れる二層市場を正当化します。
ローカルモデルが consumer GPU で SWE-bench 80% 接近:オープンウェイトの進展により、32GB 級 GPU が 2027 年中期までに SWE-bench Verified 約 80% に到達し、定常コーディング API 収益を根から揺らします。
2026年7月に最も価値があるスキルは、今日の #1 を当てることではなく、来四半期のリリースサイクルを生き残るアーキテクチャを組むことです。プライマリルートを固定する前に、次の順序で実行してください。
ボードのベースライン:openrouter.ai/rankings をブックマークし、企業・モデル Top 10 を週次スナップショット。順位だけでなくシェア差分を記録します。
ワークロードを tier タグ:各 Agent ステップを frontier(難推論・長コンテキスト)か routine(補完・要約・翻訳)に分類。frontier は Opus 4.8 または GPT-5.5、routine は DeepSeek V4 Flash または MiniMax M3 へ。
予算とフォールバック:OpenClaw や Claude Code でルート別トークン上限、日次支出上限、429/タイムアウト時のフォールバックチェーンを設定します。
20 タスクプローブ:同一プロンプトをプライマリとバリュー層で走らせ、タスク種別ごとの勝ち数を数えます。総合スコアではなく勝敗分布を見てください。
成果あたりのドル:百万トークン単価だけでなく、マージ PR 1 件・チケット 1 件・Agent 1 ランあたりのコストを記録します。
リモート Mac で VNC 受け入れ:Agent を動かす同一ホストの GUI セッションで Gateway 起動、OAuth、Keychain を完了してください。SSH のみのセットアップは macOS 権限プロンプトで静かに失敗することがあります。
{
"routing_tiers": {
"frontier": ["anthropic/claude-opus-4.8", "openai/gpt-5.5"],
"routine": ["deepseek/deepseek-v4-flash", "minimax/minimax-m3"]
},
"budgets": { "daily_usd_cap": 25, "fallback_on_429": true },
"review_cadence": "weekly_openrouter_snapshot"
}
今日のボリューム 1 位が、明日の品質上限になるとは限りません。アプリを書き換えずに差し替えられるルートを組んでください。
7 日ローリングボリューム、Anthropic プレミアムパラドックス、請求データの読み方。
読む →Top 10 スナップショット、6 大トレンド、Mac Agent 決定表。
読む →openclaw models、コスト上限、フォールバック、VNC 検収。
読む →いいえ。トークン量は本番ルーティングの経済性を示します。Claude Opus 4.8 は Artificial Analysis Intelligence Index で依然 61.4 の首位です。高ボリュームの定常作業は中国系バリュー層、最難関 5% は米国フロンティア層へ。第 03 節を参照してください。
世界中の開発者が Agent バッチトラフィックを、百万トークンあたり 8〜30 倍安い中国系 API へ移しました。日常コーディング・要約では 80〜90% 品質を維持できるため、国内選好ではなく経済性の変化です。
Claude Opus 4.8 が長時間 Agent と超長コンテキストの品質上限です。定常ステップは DeepSeek V4 Flash または MiniMax M3 へ、オーケストレーション・難解デバッグは Opus に残してください。第 04 節のユースケース表に 9 シナリオを掲載しています。
OpenClaw や Claude Code でプライマリ・フォールバックとルート別予算を定義し、常時稼働のリモート Mac 上で VNC 経由の Gateway・OAuth 受け入れを行ってください。第 06 節の Runbook とマルチモデルルーティング検収を参照してください。
2026年6月の構造的故事は「中国が勝った」ではありません。モデル層の経済マージンが圧縮されている、という話です。DeepSeek の 2025年1月リリースは、フロンティア級性能にフロンティア級コンピュートは不要だと示しました。Xiaomi、Tencent、MiniMax、Moonshot が同型のプレイブックを踏み、ベース価格を床へ押し下げています。
米国各社は分岐しています。OpenAI はエコシステム深度(プラグイン、エンタープライズ統合、Codex Mobile、画像生成)へ、Anthropic は Opus が最難 Agent eval で測定勝利する品質上限を守り、Google は Gemini Flash でマルチモーダル幅と速度を押し出しています。Claude 級でもなく、十分安くもない中間 tier が最も早く空洞化しています。
Mac 開発者にとっての隠れコストは、しばしば API 単価そのものではありません。蓋を閉じたノートで Gateway が止まること、Keychain が headless SSH を拒むこと、Q3 の 3 モデルを A/B するときに実画面が要る OAuth です。ハードを資本化する前に、常時オンラインで GUI を持つホスト上でプライマリ・フォールバックペアを検証してください。VNCMac はマルチモデル Agent ルーティング向けに物理 Mac mini ノードを月単位で提供しています。日本語購入ページ、またはホームからプランをご確認ください。