AI 市場データ 2026年7月1日 約 22 分 OpenRouter モデルルーティング

OpenRouter 2026年6月ランキング
中国系モデルがトラフィックの 61% を占拠

企業・モデル双榜 · 米国 70%→30% · 品質対ボリューム · ユースケース表 · Q3 予測

OpenRouter 2026年6月ランキング:中国系 AI モデルが開発者トークントラフィックをリード

Mac 上で Claude Code、OpenClaw、Cursor を配線しているのに、モデル選定が昨年のベンチマークシーズンのままなら、2026年6月に OpenRouter で実際に消費されているトークンこそが請求書に最も近いシグナルです。結論:OpenRouter Rankingsを基準に、中国系モデルは開発者トラフィックの 61% を超え、米国各社(Google・OpenAI・Anthropic 合算)は 12 か月で約 70% から 30% に低下しました。DeepSeek が企業別 5.13T 週次(17.6%)で首位、DeepSeek V4 Flash がモデル別 619B 日次でトップです。本稿の構成:6月の企業・モデル双榜、米国シェア急落の経済学、品質上限とボリューム王者の分離(Claude Opus 4.8 は指数 61.4 で依然 #1)、中国系 API が定常作業を獲る 3 つの構造理由、8 シナリオのユースケース表、GPT-6・Opus 5・Gemini 4 など Q3 予測、H2 2026 の 5 つのマクロトレンド、モデル非依存ルーティングの 6 段階 Runbook、Mac 受け入れの要点。6月 LLM トレンド解説週次トークンランキングOpenClaw マルチモデルルーティングと併読すると、ボード閲覧から本番ルート投入まで一気通貫で整理できます。

01

OpenRouter 2026年6月:企業榜とモデル榜の二軸

OpenRouter は世界中の開発者が実際にルーティングしたトークンを集計します。6月のスナップショットはベンダー PR ではなく、本番スコアボードです。読み方は二軸:週次ボリュームを担う企業日次で呼ばれる SKU

企業別(週次トークン量)

順位企業出身週次トークンシェア
1DeepSeek中国5.13T17.6%
2Anthropic米国4.34T14.8%
3Google米国3.66T12.5%
4OpenAI米国2.46T8.4%
5Xiaomi中国2.42T8.3%
6MiniMax中国2.37T8.1%
7Tencent中国2.36T8.1%
8Qwen(Alibaba)中国1.26T4.3%

上位 8 社のうち中国系だけで特定可能なボリュームの約 46% を占め、ボード全体では中国系モデルトラフィックが 61% を超えました。

モデル Top 10(日次トークン量)

順位モデル企業日次トークン
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

日次 Top 10 の 7 枠が中国系 SKU です。Anthropic は Claude 3 バリアントを維持しており、プレミアムモデルが本番から消えたわけではなく、Flash 級のボリュームには届いていない、という読み方が妥当です。

02

米国シェアの急落:1 年で 70% から 30%

Bloomberg や Exponential View が OpenRouter データを基に描いた曲線は明快です。2025年6月、米国各社(Google + OpenAI + Anthropic 合算)は約 70%2026年6月には約 30%。消えた 40 ポイントは、米国・欧州・インドを含む世界中の開発者が中国系オープンウェイト/バリュー層 API へ移した結果です。

これは国内選好の話ではなく、経済性の話です。サンディエゴの開発者はこう語りました。

「Claude で 1 時間コーディングすると約 10 ドル。DeepSeek なら 50 セント以下。」

モデル選定を品質だけで決めていると、次の請求書で 4 つの痛みが表面化します。

  1. 01

    単一ベンダーロックイン:全 Agent ステップを 1 つのフロンティアモデルに固定すると、Flash 級で 80〜90% 品質で済む作業にも Opus 単価を払い続けます。

  2. 02

    ベンチマークのラグ:MMLU ヘッドラインは四半期更新、OpenRouter シェアは週次で動きます。昨シーズンのリーダーボード基準の判断は請求書とズレます。

  3. 03

    Agent ボリュームの爆発:プログラミング関連トラフィックは 2025 年初頭の約 11% から 2026 年中期の 50% 超へ。バッチ Agent ループは単価差を 8〜30 倍に増幅します。

  4. 04

    コンプライアンスの盲点:エンタープライズ調達と個人開発者のルーティングは別曲線です。ボリュームシェアと Fortune 500 採用率は一致しません。

03

品質上限とボリューム王者:二つの榜を分けて読む

多くの報道は「誰が大量に呼ばれているか」と「厳しい eval で誰が勝つか」を混同します。2026年6月はこの二つが大きく乖離しています。

品質上限:Claude Opus 4.8 が依然 #1

Artificial Analysis Intelligence Index(2026年5月後半)と SWE-bench Pro が品質側の物語を示します。

モデルIntelligence IndexSWE-bench Pro備考
Claude Opus 4.861.4(#1)69.2%長コンテキスト・Agent でリード
GPT-5.559–6063.1%エコシステム・ツール呼び出しが強い
Gemini 3.1 Pro57最難推論タスク
Qwen 3.7 Max57中国系クローズドの上位
Claude Sonnet 4.680.8%(Verified)ライティング・指示追従

あるエンジニアが同一 20 タスクをフロンティア各社で走らせた結果、Opus 4.8 が 16 勝、GPT-5.5 が 5 勝、Gemini 3.1 Pro が 4 勝。長コンテキストでは Opus が「少し上」ではなく別カテゴリでした。

Claude Fable 5 も注目です。SWE-bench Verified で約 95% を含む 100/100 の品質評価を一時記録した後、2026年6月中旬の輸出規制によりグローバルルーティングから offline になりました。ボリューム榜は変わりませんが、米国側の品質上限が現行ルート可能モデルを上回り得ることを示しています。

ボリューム王者:中国系が定常作業を獲る 3 理由

  1. 01

    価格:MiniMax M3 は入力 $0.60/M、Claude Opus 4.8 は $5.00/M。高ボリュームステップでは約 8 分の 1 のコストです。

  2. 02

    十分な品質:コード補完・翻訳・要約・日常の開発支援では、中国系バリュー層がフロンティア性能の 80〜90% を提供します。

  3. 03

    オープンウェイト:DeepSeek V4 や MiniMax M3 は重みを公開。自前推論スタックを持つチームはデータ residency の懸念を下げられます。

i

判断ルール:ブランドではなくタスク難易度で振り分けてください。最難関 5% はフロンティア、残り 95% のトークンは中国系バリュー層へ。

04

ユースケース表:シナリオ別の推奨モデル(2026年6月)

ルーティング設定ドキュメントにそのまま貼れる表です。汎用リーダーボードではなく、品質・コスト・コンプライアンスのどれがそのワークロードで勝つかを示します。

シナリオ推奨モデル理由
複雑コーディング/長時間 AgentClaude Opus 4.8Intelligence Index #1、超長コンテキスト
日常の開発支援DeepSeek V4 Flash / MiMo-V2.5価格対性能・低レイテンシ
最低コストの本番 APIMiniMax M3$0.60/M、オープンウェイト、自前ホスト可
超長コンテキスト(100 万トークン超)Kimi K2.61M コンテキスト、競争力ある単価
Google Workspace/マルチモーダルGemini 3.5 FlashWorkspace ネイティブ統合、速度とコスパ
リアルタイム Web/X コンテキストGrok 4.3X/Twitter からのライブ情報取得
セルフホスト/オンプレGLM 5.2 / Kimi K2.6コーディングに強いオープンウェイト
画像生成(読めるテキスト)ChatGPT Images 2.0AI 生成画像のテキスト描画品質
総合デイリーチャットGPT-5.5GPT-5.3 比 52.5% 少ない hallucination、深いエコシステム
05

Q3 2026 リリース窗口と 5 つのマクロ予測

Q3 2026 は AI 史上、最も密度の高いフロンティアリリース四半期になりつつあります。8 月中旬から 9 月下旬の 6 週間に 3 つのフラッグシップが集中する見込みです。

Q3 の確定〜高確度リリース

モデル企業予想窗口主なアップグレード
GPT-6OpenAI2026年8〜9月150 万コンテキスト噂、Agent 強化
Claude Opus 5Anthropic2026年9月頃長期間 Agent、MCP 刷新
Gemini 4GoogleQ3 2026動画・音声・画像生成のマルチモーダル飛躍
DeepSeek V5DeepSeekQ3 2026オープンウェイト、約 1T パラメータ、Ascend スタック
GLM 5.2Zhipu AIQ3 2026コーディング・推論のオープンウェイト強化
Grok 4.3+xAIQ3 20261M コンテキスト、リアルタイム Web 強化

H2 2026 の 5 つのマクロ予測

  1. 01

    「最強モデル」指標の失効:90 日で 5 つのフロンティア級が出荷されると、ランキングはワークロード別になります。複雑度・レイテンシ・コストで切り替えるルーティング層が必須です。

  2. 02

    中国系ボリュームは上昇、エンタープライズはコンプライアンスが天井:個人開発者は OpenRouter 中国系シェアを 70% 超へ押し上げ得ますが、Fortune 500 はデータ residency と米議会の監視で頭打ちです。

  3. 03

    Agent 性能がエンタープライズ KPI に:Anthropic の 2026 State of AI Agents 報告では Claude API 利用の 44% が数学・コンピュータタスク。SWE-bench Pro と長期間 Agent eval で負けるラボは enterprise 案件を失います。

  4. 04

    IPO 圧力が価格を再編:OpenAI と Anthropic は 2026年6月に IPO 意向を示しました。上場後のマージン圧力が tier 分離を加速し、コスト敏感な作業は最安 API へ流れる二層市場を正当化します。

  5. 05

    ローカルモデルが consumer GPU で SWE-bench 80% 接近:オープンウェイトの進展により、32GB 級 GPU が 2027 年中期までに SWE-bench Verified 約 80% に到達し、定常コーディング API 収益を根から揺らします。

06

6 段階 Runbook:Mac 上のモデル非依存ルーティング

2026年7月に最も価値があるスキルは、今日の #1 を当てることではなく、来四半期のリリースサイクルを生き残るアーキテクチャを組むことです。プライマリルートを固定する前に、次の順序で実行してください。

  1. 01

    ボードのベースライン:openrouter.ai/rankings をブックマークし、企業・モデル Top 10 を週次スナップショット。順位だけでなくシェア差分を記録します。

  2. 02

    ワークロードを tier タグ:各 Agent ステップを frontier(難推論・長コンテキスト)か routine(補完・要約・翻訳)に分類。frontier は Opus 4.8 または GPT-5.5、routine は DeepSeek V4 Flash または MiniMax M3 へ。

  3. 03

    予算とフォールバック:OpenClaw や Claude Code でルート別トークン上限、日次支出上限、429/タイムアウト時のフォールバックチェーンを設定します。

  4. 04

    20 タスクプローブ:同一プロンプトをプライマリとバリュー層で走らせ、タスク種別ごとの勝ち数を数えます。総合スコアではなく勝敗分布を見てください。

  5. 05

    成果あたりのドル:百万トークン単価だけでなく、マージ PR 1 件・チケット 1 件・Agent 1 ランあたりのコストを記録します。

  6. 06

    リモート Mac で VNC 受け入れ:Agent を動かす同一ホストの GUI セッションで Gateway 起動、OAuth、Keychain を完了してください。SSH のみのセットアップは macOS 権限プロンプトで静かに失敗することがあります。

json
{
  "routing_tiers": {
    "frontier": ["anthropic/claude-opus-4.8", "openai/gpt-5.5"],
    "routine": ["deepseek/deepseek-v4-flash", "minimax/minimax-m3"]
  },
  "budgets": { "daily_usd_cap": 25, "fallback_on_429": true },
  "review_cadence": "weekly_openrouter_snapshot"
}
07

チケット・定例に貼れる引用可能ファクト

  • ファクト 1:中国系モデルは 2026年6月の OpenRouter 開発者トラフィック 61% を超過。米国各社は 12 か月で約 70%→30%
  • ファクト 2:DeepSeek が企業別 5.13T 週次(17.6%)、DeepSeek V4 Flash がモデル別 619B 日次で首位。
  • ファクト 3:Claude Opus 4.8 は Intelligence Index 61.4(#1) だが、MiniMax M3 は $0.60/M 対 Opus $5.00/M で定常ステップは約 8 倍の単価差。
  • ファクト 4:20 タスク対決で Opus 4.8 が 16 勝。品質王とボリューム王は別称号です。
  • ファクト 5:Claude Fable 5 は輸出規制前 100/100。米国側の品質上限は現行ルート可能モデルを上回り得ます。

今日のボリューム 1 位が、明日の品質上限になるとは限りません。アプリを書き換えずに差し替えられるルートを組んでください。

関連記事

VNCMac 関連ガイド

FAQ

よくある質問

いいえ。トークン量は本番ルーティングの経済性を示します。Claude Opus 4.8 は Artificial Analysis Intelligence Index で依然 61.4 の首位です。高ボリュームの定常作業は中国系バリュー層、最難関 5% は米国フロンティア層へ。第 03 節を参照してください。

世界中の開発者が Agent バッチトラフィックを、百万トークンあたり 8〜30 倍安い中国系 API へ移しました。日常コーディング・要約では 80〜90% 品質を維持できるため、国内選好ではなく経済性の変化です。

Claude Opus 4.8 が長時間 Agent と超長コンテキストの品質上限です。定常ステップは DeepSeek V4 Flash または MiniMax M3 へ、オーケストレーション・難解デバッグは Opus に残してください。第 04 節のユースケース表に 9 シナリオを掲載しています。

OpenClaw や Claude Code でプライマリ・フォールバックとルート別予算を定義し、常時稼働のリモート Mac 上で VNC 経由の Gateway・OAuth 受け入れを行ってください。第 06 節の Runbook とマルチモデルルーティング検収を参照してください。

おわりに

2026年6月の構造的故事は「中国が勝った」ではありません。モデル層の経済マージンが圧縮されている、という話です。DeepSeek の 2025年1月リリースは、フロンティア級性能にフロンティア級コンピュートは不要だと示しました。Xiaomi、Tencent、MiniMax、Moonshot が同型のプレイブックを踏み、ベース価格を床へ押し下げています。

米国各社は分岐しています。OpenAI はエコシステム深度(プラグイン、エンタープライズ統合、Codex Mobile、画像生成)へ、Anthropic は Opus が最難 Agent eval で測定勝利する品質上限を守り、Google は Gemini Flash でマルチモーダル幅と速度を押し出しています。Claude 級でもなく、十分安くもない中間 tier が最も早く空洞化しています。

Mac 開発者にとっての隠れコストは、しばしば API 単価そのものではありません。蓋を閉じたノートで Gateway が止まること、Keychain が headless SSH を拒むこと、Q3 の 3 モデルを A/B するときに実画面が要る OAuth です。ハードを資本化する前に、常時オンラインで GUI を持つホスト上でプライマリ・フォールバックペアを検証してください。VNCMac はマルチモデル Agent ルーティング向けに物理 Mac mini ノードを月単位で提供しています。日本語購入ページ、またはホームからプランをご確認ください。