Данные рынка ИИ 1 июля 2026 ~22 мин OpenRouter Маршрутизация моделей

OpenRouter июнь 2026
Китайские модели — 61% трафика

Рейтинги компаний и моделей · США 70%→30% · Качество vs объём · Матрица use-case · Прогноз Q3

Рейтинг OpenRouter июнь 2026: китайские AI-модели лидируют по токен-трафику разработчиков

Если вы подключаете Claude Code, OpenClaw или Cursor на Mac, но выбираете модели по бенчмаркам прошлого сезона, кто реально сжигает токены на OpenRouter в июне 2026 — сигнал ближе к вашему счёту. Итог: по OpenRouter Rankings китайские модели превысили 61% трафика разработчиков; US-лабы (Google, OpenAI, Anthropic вместе) за 12 месяцев упали с ~70% до 30%. DeepSeek лидирует среди компаний — 5,13T в неделю (17,6%), DeepSeek V4 Flash среди моделей — 619B в день. В статье: двойной рейтинг июня, экономика обвала доли США, разделение качества и объёма (Claude Opus 4.8 — индекс 61,4), три структурные причины успеха китайских API, матрица use-case (9 сценариев), окно Q3 (GPT-6, Opus 5, Gemini 4, DeepSeek V5, GLM 5.2, Grok 4.3+), пять макротрендов H2 2026, шестишаговый model-agnostic runbook, заметки для Mac. См. также тренды LLM за июнь, недельный рейтинг токенов, мультимодельная маршрутизация OpenClaw.

01

OpenRouter июнь 2026: двойной рейтинг компаний и моделей

OpenRouter агрегирует реально маршрутизированные токены миллионов разработчиков. Снимок за июнь — не пресс-релиз, а продакшен-табло. Читайте по двум осям: недельный объём по компаниям и SKU, вызываемые каждый день.

По компаниям (недельный объём токенов)

МестоКомпанияПроисхождениеТокены/нед.Доля
1DeepSeekКитай5,13T17,6%
2AnthropicСША4,34T14,8%
3GoogleСША3,66T12,5%
4OpenAIСША2,46T8,4%
5XiaomiКитай2,42T8,3%
6MiniMaxКитай2,37T8,1%
7TencentКитай2,36T8,1%
8Qwen (Alibaba)Китай1,26T4,3%

Китайские компании в топ-8 дают ~46% идентифицируемого объёма; суммарный китайский трафик в июне превысил 61%.

Топ-10 моделей (дневной объём)

МестоМодельКомпанияТокены/день
1DeepSeek V4 FlashDeepSeek619B
2Hy3 PreviewTencent451B
3MiniMax M3MiniMax447B
4MiMo-V2.5Xiaomi327B
5DeepSeek V4 ProDeepSeek300B
6Claude Opus 4.7Anthropic263B
7Claude Opus 4.8Anthropic~200B
8Claude Sonnet 4.6Anthropic178B
9Gemini 3 Flash PreviewGoogle156B
10Kimi K2.6Moonshot AI~150B

Семь из десяти дневных лидеров — китайские SKU. Anthropic держит три варианта Claude: премиум в проде, но не в Flash-объёме.

02

Обвал доли США: с 70% до 30% за год

Графики Bloomberg и Exponential View на данных OpenRouter однозначны. В июне 2025 US-лабы вместе ~70%. В июне 2026 ~30%. 40 п.п. ушли в китайские open-weight и value API, которые выбирают разработчики в США, Европе, Индии и за их пределами.

Это не история о национальных предпочтениях — история о юнит-экономике. Разработчик из Сан-Дiego формулирует так:

«Час кодинга на Claude — около $10, на DeepSeek — меньше 50 центов.»

  1. 01

    Lock-in одного вендора: каждый шаг Agent на самом дорогом frontier — вы платите тариф Opus за задачи, которые Flash-tier закрывает на 80–90% качества.

  2. 02

    Лаг бенчмарков: MMLU обновляется поквартально, доля OpenRouter — еженедельно.

  3. 03

    Взрыв объёма Agent: программный трафик ~11% (начало 2025) → >50% (середина 2026); batch-циклы усиливают разрыв в 8–30×.

  4. 04

    Слепые зоны compliance: enterprise-закупки и indie-маршрутизация идут разными кривыми.

03

Потолок качества vs чемпион по объёму

Claude Opus 4.8 по-прежнему #1 по качеству

МодельIntelligence IndexSWE-bench ProПримечание
Claude Opus 4.861,4 (#1)69,2%Long context, агенты
GPT-5.559–6063,1%Экосистема, tool calls
Gemini 3.1 Pro57Сложнейшее рассуждение
Qwen 3.7 Max57Топ закрытой китайской модели
Claude Sonnet 4.680,8% (Verified)Тексты, следование инструкциям

На 20 одинаковых задачах Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. В long context Opus был не «чуть лучше», а в другой лиге.

Claude Fable 5 кратко держал 100/100 (включая ~95% SWE-bench Verified), затем в середине июня 2026 исчез из глобальной маршрутизации из-за экспортных ограничений. Объёмный рейтинг не меняется, но US-потолок качества может быть выше доступных сегодня моделей.

Три причины, почему китайские модели берут рутину

  1. 01

    Цена: MiniMax M3 — $0,60/M, Opus 4.8 — $5,00/M, примерно в 8 раз дешевле на высокообъёмных шагах.

  2. 02

    Достаточное качество: автодополнение, перевод, суммаризация — 80–90% frontier.

  3. 03

    Open weights: DeepSeek V4, MiniMax M3 — self-host, data residency.

i

Правило: маршрутизируйте по сложности задачи, не по бренду. Frontier — для 5% самых сложных; value-tier — для остальных 95% объёма.

04

Матрица use-case: лучшая модель по сценарию (июнь 2026)

СценарийРекомендуемая модельПочему
Сложный код / длительные агентыClaude Opus 4.8Index #1, long context
Ежедневная dev-помощьDeepSeek V4 Flash / MiMo-V2.5Цена/perf, низкая задержка
Самая дешёвая prod APIMiniMax M3$0,60/M, open weights
Ultra-long context (1M+)Kimi K2.6Окно 1M, конкурентная цена
Google Workspace / multimodalGemini 3.5 FlashНативная интеграция Workspace
Realtime web / контекст XGrok 4.3Живые данные X/Twitter
Self-hosted / on-premGLM 5.2 / Kimi K2.6Сильные open-weight для кода
Генерация изображений с читаемым текстомChatGPT Images 2.0Лучший рендер текста
Лучший daily chatGPT-5.5На 52,5% меньше галлюцинаций vs GPT-5.3
05

Q3 2026: окно релизов и пять макропрогнозов

Q3: подтверждённые и высоковероятные релизы

МодельКомпанияОкноКлючевые апгрейды
GPT-6OpenAIавг–сен 2026~1,5M context, усиленные агенты
Claude Opus 5Anthropic~сен 2026Long-horizon agent, refresh MCP
Gemini 4GoogleQ3 2026Multimodal: видео, аудио, изображения
DeepSeek V5DeepSeekQ3 2026Open weights, ~1T params, Ascend
GLM 5.2Zhipu AIQ3 2026Open-weight coding/reasoning
Grok 4.3+xAIQ3 20261M context, realtime web

Пять макропрогнозов на H2 2026

  1. 01

    «Лучшая модель» теряет смысл: пять frontier за 90 дней → рейтинги по workload; нужен routing layer.

  2. 02

    Китайский объём растёт; enterprise compliance — потолок: indie может дойти до 70%+; Fortune 500 ограничена residency и Конгрессом США.

  3. 03

    Agentic performance — KPI enterprise: State of AI Agents 2026 Anthropic — 44% использования Claude API на math/computer tasks.

  4. 04

    IPO давит на цены: OpenAI и Anthropic в июне 2026 сигнализировали IPO — маржа публичного рынка ускорит tier-разделение.

  5. 05

    Локальные модели ~80% SWE-bench на consumer GPU: 32 ГБ к середине 2027 — давление на выручку routine coding API.

06

Шестишаговый runbook: model-agnostic routing на Mac

  1. 01

    Baseline доски: еженедельный snapshot openrouter.ai/rankings, дельты долей.

  2. 02

    Теги workload: frontier vs routine. Frontier: Opus 4.8/GPT-5.5; routine: DeepSeek V4 Flash/MiniMax M3.

  3. 03

    Бюджеты и fallback: caps токенов, дневной лимит, цепочка 429 в OpenClaw/Claude Code.

  4. 04

    Probe 20 задач: одинаковые промпты, победы по типу задачи.

  5. 05

    Доллары за outcome: стоимость PR, тикета, run Agent.

  6. 06

    Приёмка VNC на удалённом Mac: Gateway, OAuth, Keychain в GUI на хосте Agent.

json
{
  "routing_tiers": {
    "frontier": ["anthropic/claude-opus-4.8", "openai/gpt-5.5"],
    "routine": ["deepseek/deepseek-v4-flash", "minimax/minimax-m3"]
  },
  "budgets": { "daily_usd_cap": 25, "fallback_on_429": true },
  "review_cadence": "weekly_openrouter_snapshot"
}
07

Цитируемые факты для тикетов и standup

  • Факт 1: Китайские модели — 61% трафика OpenRouter (июнь 2026); США 70→30% за 12 месяцев.
  • Факт 2: DeepSeek 5,13T/нед. (17,6%); DeepSeek V4 Flash 619B/день.
  • Факт 3: Opus 4.8 index 61,4; MiniMax M3 $0,60/M vs Opus $5,00/M.
  • Факт 4: Shootout 20 задач: Opus 4.8 — 16 побед.
  • Факт 5: Claude Fable 5 — 100/100 до экспортного бана в середине июня.

Лидер объёма сегодня — не потолок качества завтра. Стройте маршруты, которые меняются без переписывания приложения.

Читать далее

Связанные материалы VNCMac

FAQ

Частые вопросы

Нет. Объём отражает экономику маршрутизации; Opus 4.8 лидирует с index 61,4. Value-tier для рутины, frontier — для 5% сложнейших задач. Раздел 03.

Batch Agent ушёл на API в 8–30 раз дешевле с 80–90% качества в повседневных задачах — экономический сдвиг, не национальные предпочтения.

Claude Opus 4.8 для long context и длительных агентов. Рутина: DeepSeek V4 Flash/MiniMax M3. Матрица — раздел 04.

Primary/fallback и бюджеты в OpenClaw/Claude Code, затем VNC на удалённом Mac. Runbook — раздел 06, чеклист мультимодельной маршрутизации.

Итог

Структурная история июня 2026 — не «Китай победил», а сжатие экономической маржи в слое моделей. Релиз DeepSeek в январе 2025 показал: frontier-качество не требует frontier-compute; Xiaomi, Tencent, MiniMax и Moonshot опустили базовые цены к полу.

US-лабы расходятся: OpenAI — глубина экосистемы, Anthropic — измеримый потолок Opus в agent evals, Google — широта multimodal через Gemini Flash. Средний tier — ни Claude-grade, ни достаточно дёшев — опустошается быстрее всего.

Для Mac-разработчиков скрытый налог — редко только тариф API: уснувший ноутбук, Keychain без GUI, OAuth при A/B трёх моделей Q3. Проверьте primary/fallback на хосте с GUI до покупки железа. VNCMac сдаёт физические Mac mini для мультимодельного Agent routing — тарифы, главная.