Рейтинги компаний и моделей · США 70%→30% · Качество vs объём · Матрица use-case · Прогноз Q3
Если вы подключаете Claude Code, OpenClaw или Cursor на Mac, но выбираете модели по бенчмаркам прошлого сезона, кто реально сжигает токены на OpenRouter в июне 2026 — сигнал ближе к вашему счёту. Итог: по OpenRouter Rankings китайские модели превысили 61% трафика разработчиков; US-лабы (Google, OpenAI, Anthropic вместе) за 12 месяцев упали с ~70% до 30%. DeepSeek лидирует среди компаний — 5,13T в неделю (17,6%), DeepSeek V4 Flash среди моделей — 619B в день. В статье: двойной рейтинг июня, экономика обвала доли США, разделение качества и объёма (Claude Opus 4.8 — индекс 61,4), три структурные причины успеха китайских API, матрица use-case (9 сценариев), окно Q3 (GPT-6, Opus 5, Gemini 4, DeepSeek V5, GLM 5.2, Grok 4.3+), пять макротрендов H2 2026, шестишаговый model-agnostic runbook, заметки для Mac. См. также тренды LLM за июнь, недельный рейтинг токенов, мультимодельная маршрутизация OpenClaw.
OpenRouter агрегирует реально маршрутизированные токены миллионов разработчиков. Снимок за июнь — не пресс-релиз, а продакшен-табло. Читайте по двум осям: недельный объём по компаниям и SKU, вызываемые каждый день.
| Место | Компания | Происхождение | Токены/нед. | Доля |
|---|---|---|---|---|
| 1 | DeepSeek | Китай | 5,13T | 17,6% |
| 2 | Anthropic | США | 4,34T | 14,8% |
| 3 | США | 3,66T | 12,5% | |
| 4 | OpenAI | США | 2,46T | 8,4% |
| 5 | Xiaomi | Китай | 2,42T | 8,3% |
| 6 | MiniMax | Китай | 2,37T | 8,1% |
| 7 | Tencent | Китай | 2,36T | 8,1% |
| 8 | Qwen (Alibaba) | Китай | 1,26T | 4,3% |
Китайские компании в топ-8 дают ~46% идентифицируемого объёма; суммарный китайский трафик в июне превысил 61%.
| Место | Модель | Компания | Токены/день |
|---|---|---|---|
| 1 | DeepSeek V4 Flash | DeepSeek | 619B |
| 2 | Hy3 Preview | Tencent | 451B |
| 3 | MiniMax M3 | MiniMax | 447B |
| 4 | MiMo-V2.5 | Xiaomi | 327B |
| 5 | DeepSeek V4 Pro | DeepSeek | 300B |
| 6 | Claude Opus 4.7 | Anthropic | 263B |
| 7 | Claude Opus 4.8 | Anthropic | ~200B |
| 8 | Claude Sonnet 4.6 | Anthropic | 178B |
| 9 | Gemini 3 Flash Preview | 156B | |
| 10 | Kimi K2.6 | Moonshot AI | ~150B |
Семь из десяти дневных лидеров — китайские SKU. Anthropic держит три варианта Claude: премиум в проде, но не в Flash-объёме.
Графики Bloomberg и Exponential View на данных OpenRouter однозначны. В июне 2025 US-лабы вместе ~70%. В июне 2026 ~30%. 40 п.п. ушли в китайские open-weight и value API, которые выбирают разработчики в США, Европе, Индии и за их пределами.
Это не история о национальных предпочтениях — история о юнит-экономике. Разработчик из Сан-Дiego формулирует так:
«Час кодинга на Claude — около $10, на DeepSeek — меньше 50 центов.»
Lock-in одного вендора: каждый шаг Agent на самом дорогом frontier — вы платите тариф Opus за задачи, которые Flash-tier закрывает на 80–90% качества.
Лаг бенчмарков: MMLU обновляется поквартально, доля OpenRouter — еженедельно.
Взрыв объёма Agent: программный трафик ~11% (начало 2025) → >50% (середина 2026); batch-циклы усиливают разрыв в 8–30×.
Слепые зоны compliance: enterprise-закупки и indie-маршрутизация идут разными кривыми.
| Модель | Intelligence Index | SWE-bench Pro | Примечание |
|---|---|---|---|
| Claude Opus 4.8 | 61,4 (#1) | 69,2% | Long context, агенты |
| GPT-5.5 | 59–60 | 63,1% | Экосистема, tool calls |
| Gemini 3.1 Pro | 57 | — | Сложнейшее рассуждение |
| Qwen 3.7 Max | 57 | — | Топ закрытой китайской модели |
| Claude Sonnet 4.6 | — | 80,8% (Verified) | Тексты, следование инструкциям |
На 20 одинаковых задачах Opus 4.8 выиграл 16, GPT-5.5 — 5, Gemini 3.1 Pro — 4. В long context Opus был не «чуть лучше», а в другой лиге.
Claude Fable 5 кратко держал 100/100 (включая ~95% SWE-bench Verified), затем в середине июня 2026 исчез из глобальной маршрутизации из-за экспортных ограничений. Объёмный рейтинг не меняется, но US-потолок качества может быть выше доступных сегодня моделей.
Цена: MiniMax M3 — $0,60/M, Opus 4.8 — $5,00/M, примерно в 8 раз дешевле на высокообъёмных шагах.
Достаточное качество: автодополнение, перевод, суммаризация — 80–90% frontier.
Open weights: DeepSeek V4, MiniMax M3 — self-host, data residency.
Правило: маршрутизируйте по сложности задачи, не по бренду. Frontier — для 5% самых сложных; value-tier — для остальных 95% объёма.
| Сценарий | Рекомендуемая модель | Почему |
|---|---|---|
| Сложный код / длительные агенты | Claude Opus 4.8 | Index #1, long context |
| Ежедневная dev-помощь | DeepSeek V4 Flash / MiMo-V2.5 | Цена/perf, низкая задержка |
| Самая дешёвая prod API | MiniMax M3 | $0,60/M, open weights |
| Ultra-long context (1M+) | Kimi K2.6 | Окно 1M, конкурентная цена |
| Google Workspace / multimodal | Gemini 3.5 Flash | Нативная интеграция Workspace |
| Realtime web / контекст X | Grok 4.3 | Живые данные X/Twitter |
| Self-hosted / on-prem | GLM 5.2 / Kimi K2.6 | Сильные open-weight для кода |
| Генерация изображений с читаемым текстом | ChatGPT Images 2.0 | Лучший рендер текста |
| Лучший daily chat | GPT-5.5 | На 52,5% меньше галлюцинаций vs GPT-5.3 |
| Модель | Компания | Окно | Ключевые апгрейды |
|---|---|---|---|
| GPT-6 | OpenAI | авг–сен 2026 | ~1,5M context, усиленные агенты |
| Claude Opus 5 | Anthropic | ~сен 2026 | Long-horizon agent, refresh MCP |
| Gemini 4 | Q3 2026 | Multimodal: видео, аудио, изображения | |
| DeepSeek V5 | DeepSeek | Q3 2026 | Open weights, ~1T params, Ascend |
| GLM 5.2 | Zhipu AI | Q3 2026 | Open-weight coding/reasoning |
| Grok 4.3+ | xAI | Q3 2026 | 1M context, realtime web |
«Лучшая модель» теряет смысл: пять frontier за 90 дней → рейтинги по workload; нужен routing layer.
Китайский объём растёт; enterprise compliance — потолок: indie может дойти до 70%+; Fortune 500 ограничена residency и Конгрессом США.
Agentic performance — KPI enterprise: State of AI Agents 2026 Anthropic — 44% использования Claude API на math/computer tasks.
IPO давит на цены: OpenAI и Anthropic в июне 2026 сигнализировали IPO — маржа публичного рынка ускорит tier-разделение.
Локальные модели ~80% SWE-bench на consumer GPU: 32 ГБ к середине 2027 — давление на выручку routine coding API.
Baseline доски: еженедельный snapshot openrouter.ai/rankings, дельты долей.
Теги workload: frontier vs routine. Frontier: Opus 4.8/GPT-5.5; routine: DeepSeek V4 Flash/MiniMax M3.
Бюджеты и fallback: caps токенов, дневной лимит, цепочка 429 в OpenClaw/Claude Code.
Probe 20 задач: одинаковые промпты, победы по типу задачи.
Доллары за outcome: стоимость PR, тикета, run Agent.
Приёмка VNC на удалённом Mac: Gateway, OAuth, Keychain в GUI на хосте Agent.
{
"routing_tiers": {
"frontier": ["anthropic/claude-opus-4.8", "openai/gpt-5.5"],
"routine": ["deepseek/deepseek-v4-flash", "minimax/minimax-m3"]
},
"budgets": { "daily_usd_cap": 25, "fallback_on_429": true },
"review_cadence": "weekly_openrouter_snapshot"
}
Лидер объёма сегодня — не потолок качества завтра. Стройте маршруты, которые меняются без переписывания приложения.
7-дневный rolling, парадокс Anthropic premium.
Читать →Top 10, шесть макротрендов, матрицы Mac Agent.
Читать →openclaw models, стоимость, fallback, VNC.
Читать →Нет. Объём отражает экономику маршрутизации; Opus 4.8 лидирует с index 61,4. Value-tier для рутины, frontier — для 5% сложнейших задач. Раздел 03.
Batch Agent ушёл на API в 8–30 раз дешевле с 80–90% качества в повседневных задачах — экономический сдвиг, не национальные предпочтения.
Claude Opus 4.8 для long context и длительных агентов. Рутина: DeepSeek V4 Flash/MiniMax M3. Матрица — раздел 04.
Primary/fallback и бюджеты в OpenClaw/Claude Code, затем VNC на удалённом Mac. Runbook — раздел 06, чеклист мультимодельной маршрутизации.
Структурная история июня 2026 — не «Китай победил», а сжатие экономической маржи в слое моделей. Релиз DeepSeek в январе 2025 показал: frontier-качество не требует frontier-compute; Xiaomi, Tencent, MiniMax и Moonshot опустили базовые цены к полу.
US-лабы расходятся: OpenAI — глубина экосистемы, Anthropic — измеримый потолок Opus в agent evals, Google — широта multimodal через Gemini Flash. Средний tier — ни Claude-grade, ни достаточно дёшев — опустошается быстрее всего.
Для Mac-разработчиков скрытый налог — редко только тариф API: уснувший ноутбук, Keychain без GUI, OAuth при A/B трёх моделей Q3. Проверьте primary/fallback на хосте с GUI до покупки железа. VNCMac сдаёт физические Mac mini для мультимодельного Agent routing — тарифы, главная.