Рынок ИИ 6 июня 2026 г. около 24 мин OpenRouter Токены

Недельный рейтинг OpenRouter
Данные счёта не врут — кто настоящий король?

Скользящие 7 дней · 28,9 трлн в неделю · Китай vs США · парадокс Anthropic · маршрутизация Agent в пять шагов

Недельный рейтинг токенов OpenRouter и визуализация рынка моделей ИИ

Если вы выбираете модель для Agent и тонете в скриншотах бенчмарков с презентаций, важнее кто реально вызывается, сколько токенов сжигается за неделю и куда смотрит счёт — это ближе к продакшену, чем лабораторный балл. Вывод: по OpenRouter Rankings (скользящее окно 7 дней) неделя 18–24 мая 2026 дала 28,9 трлн токенов глобально; DeepSeek-V4-Flash лидирует с 3,43T. Китайские модели четвёртую неделю подряд опережают США; у Anthropic — парадокс премии: падающая доля токенов при высокой выручке в долларах. В статье: счёт vs бенчмарк, методика, Top 10, двойная правда вендоров, разворот бенчмарк/рынок, еженедельный трекинг и маршрутизация в пять шагов, приёмка Mac для OpenClaw/Claude Code. См. тренды LLM июня, локальный ds4.

01

Почему данные счёта честнее бенчмарков

MMLU, HumanEval и SWE-bench отвечают на вопрос: каков предел модели на фиксированных датасетах? OpenRouter как нейтральный API-агрегатор соединяет 300+ моделей от 60+ поставщиков с более чем 8 млн пользователей и обрабатывает около 100 трлн токенов в месяц. Рейтинг считает реальные входящие и исходящие токены, прошедшие через платформу. Потраченные деньги и compute не врут: разработчики голосуют кошельком за скорость, стабильность и цену.

В 2026 году доминируют Agent-workflow. Доля задач программирования выросла с ~11 % в начале 2025 до более 50 % — крупнейший одиночный сценарий. Отчёт OpenRouter / a16z «2025 AI Usage» (100 трлн анонимных метаданных) показывает: балл бенчмарка и доля рынка часто обратно коррелируют. Дорогие флагманы не получают автоматически максимальный трафик; сверхдешёвые модели поглощают batch Agent.

  1. 1

    Бенчмарк = потолок: разовые прогоны с фиксированными промптами не отражают цепочки tool-call и длинный reasoning.

  2. 2

    Недельные токены = пульс: пять недель роста подряд — реальный спрос, а не маркетинговый всплеск.

  3. 3

    Две оси: доля токенов и доля выручки в USD разделяют «короля трафика» и «короля маржи».

02

Источник и методика (скользящие 7 дней)

Все цифры — с openrouter.ai/rankings. Период — недельный, скользящий 7-дневный throughput токенов, как на платформе. Ключевые измерения: недельный суммарный объём (вход+выход), рейтинг моделей, доли вендоров, выручка USD vs доля токенов.

Окно съёма: 18–24 мая 2026 (на момент публикации — последняя полная неделя на сайте). Позже смотрите live-данные; логика чтения остаётся.

Масштаб: год назад ~2,4 трлн токенов в неделю, сейчас 28,9 трлн — рост примерно в 12 раз за год. ИИ перешёл от пилота к масштабу.

03

Глобальная неделя: 28,9 трлн токенов, пятый рост подряд

ПоказательЗначениеИзменение
Глобальный недельный объём28,9 трлн токенов+7,4 % (5-я неделя подряд)
Китайские модели9,223 трлн токенов+19,89 %
Модели США4,93 трлн токенов+16,27 %
ГеополитикаКитай четыре недели подряд впереди США

Типичные ошибки чтения:

  1. 1

    Дневной пик за неделю: рейтинг крутится 7 дней — не смешивать с разовым максимумом.

  2. 2

    Игнор «остального мира»: европейский open source и Stealth-модели тоже в потоке.

  3. 3

    Устаревшие месячные данные: Hy3 и Owl Alpha могут расти на двузначные % за неделю — маршрутизацию обновлять еженедельно.

  4. 4

    Только ранг, без цены: лидеры часто «очень дёшево × очень много throughput», не финальная модель ревью.

04

Top 10 моделей недели (на 24.05.2026)

МестоМодельВендорТокены/недWoWПрофиль
1DeepSeek-V4-FlashDeepSeek (Китай)3,43T+66 %Agent, минимальная цена
2Tencent Hy3 PreviewTencent (Китай)3,07T+16 %Новинка, взрывной рост
3Claude Sonnet 4.6Anthropic (США)1,35T1M контекст, enterprise-код
4DeepSeek-V3.2DeepSeek (Китай)1,31TДёшево, long tail
5Owl AlphaOpenRouter (stealth)1,15T+29 %Бесплатный Agent, 1M контекст
6Gemini 3 Flash PreviewGoogle (США)1,06TМультимодал, наука/медицина
7DeepSeek-V4-ProDeepSeek (Китай)1,00TФлагман, тяжёлый вывод
8MiniMax M2.7MiniMax (Китай)806BДлинный контекст, цена
9Grok 4.1 FastxAI (США)721B2M контекст, силён в праве
10Step 3.5 FlashStepFun (Китай)673BБыстро, batch

Источники: места 1–2 и 5 (недельные токены и WoW) — по National Business Daily об OpenRouter за 18–24 мая 2026. Места 3–4, 6 и 8–10 сверены с публичным рейтингом и отраслевыми разборами. DeepSeek-V4-Pro: 1,00T — из суммы серии 5,74T минус V4-Flash (3,43T) и V3.2 (1,31T). Kimi K2.6 (6-й на прошлой неделе) вышел из top 10 и в таблицу не включён.

Матрица DeepSeek вместо одиночного хита

V4-Flash, V4-Pro и V3.2 одновременно в top 9. Серия даёт ~5,74 трлн токенов в неделю (+25,9 % WoW) и вторую неделю подряд обгоняет Anthropic и Google по вендору. Цитируемый вывод: Flash несёт объём, Pro — сложные задачи, V3.2 — long tail; продуктовая матрица, не один бестселлер.

05

Вендоры: токены vs доллары — двойная правда

Рост китайских моделей

ПериодДоля китайских моделей (ок.)
Начало 2025< 2 %
Февраль 2026Первая неделя впереди США
Май 2026~45 %+, четыре недели лидерства

Парадокс премии Anthropic

У Anthropic ~12 % доли токенов (год назад ~25 %), но ~46 % выручки в USD. Enterprise платит премию за Claude Opus 4.6 и аналоги — объём токенов остаётся долей от DeepSeek Flash. Трафик уходит к эффективности, маржа остаётся у premium closed source.

Матрица решений по сегментам

СегментПримерыНедельный профильЗадачи
Высокая ценность · малый трафикClaude OpusМало токенов, много выручкиEnterprise-reasoning, compliance
Середина · стабильный трафикGemini FlashРост мультимодалаНаука, медицина, текст+изображение
Дёшево · высокий трафикDeepSeek / Hy3 / MiniMax / StepFunВершина рейтингаAgent, код, batch
06

Разворот бенчмарк/рынок: лаборатория vs прод

Пока каждый пункт SWE-bench попадает в заголовки, прод массово маршрутизирует запросы к Flash около $0,10 / $0,40 за миллион токенов. Причины:

  1. 1

    Стоимость важнее максимума: при многократных вызовах Agent исходящие токены доминируют в счёте.

  2. 2

    Стабильность важнее удачного ответа: ошибки tool-call и latency важнее разового блеска.

  3. 3

    Код — главное поле: более 50 % трафика связано с кодом — вершина рейтинга это отражает.

Цифра для цитирования: DeepSeek-V4-Flash +66 % WoW без недели маркетинга нового SOTA — счёт честнее любого leaderboard.

07

Почему недельный рейтинг стал стратегическим в 2026

Инвесторы смотрят на данные типа OpenRouter для коммерциализации ИИ; разработчики — для vendor-neutral маршрутизации; исследования — для геополитики и архитектур; медиа — для ответа «кто реально выигрывает». Объём токенов из техметрики стал коммерческим барометром — обновляется еженедельно, публичен, редко попадает в личные чеклисты. На Mac этот рейтинг стоит читать как еженедельный отчёт, а не как шум после keynote.

08

Еженедельный трекинг и маршрутизация — пять шагов

  1. 1

    Счёт, не keynote: по понедельникам открывать Rankings, сравнивать WoW top 3 со своим расходом OpenRouter.

  2. 2

    Маршрут по сценарию: Agent/batch → DeepSeek-V4-Flash; тяжёлый вывод → Claude Opus; мультимодал → Gemini Flash.

  3. 3

    Следить за новинками: Hy3 Preview, Owl Alpha — высокий WoW = следующий резервный кандидат.

  4. 4

    Бюджет и деградация: в OpenClaw/Claude Code — основная/резервная/ревью-модель и лимит токенов на задачу.

  5. 5

    GUI-приёмка на Mac: Gateway, OAuth и Keychain требуют интерфейс macOS — одного SSH мало. VNC на арендованном удалённом Mac, smoke-test 20 минут (см. серию OpenClaw).

Чеклист приёмки: ① закладка Rankings; ② три имени моделей; ③ токены и оценка USD за прошлую неделю; ④ ошибки Agent; ⑤ скрин VNC Gateway 200 — тогда «знание рейтинга» становится операционным.

Читать далее
FAQ

Частые вопросы

Бенчмарки измеряют предельные возможности; недельные токены — реальные платежи и маршрутизацию. Сверяйте оба; счёт доказывает массовые вызовы.

Claude Opus на порядки дороже DeepSeek Flash за миллион токенов. Enterprise платит премию; batch Agent уходит к дешёвым моделям — парадокс премии.

DeepSeek, Tencent Hy3, MiniMax: низкие цены API и открытые лицензии для Agent/кода. Неделя 18–24 мая: Китай ~9,22T, США ~4,93T токенов.

Rankings еженедельно; модели и бюджет в OpenClaw/Claude Code; VNC удалённый Mac для Gateway/OAuth. См. раздел 08.

Итог

Данные третьей недели мая 2026 показывают: рынок голосует деньгами — китайские open-weight модели меняют глобальную картину токенов через крайнюю экономичность. Важно не только «кто умнее», а кто чаще вызывается — это двигает внедрение. Рост недельного объёма в 12 раз за год делает чтение рейтинга рутиной разработчика, а не темой после презентации.

Для пользователей Mac скрытый счёт часто не в тарифе API, а в засыпающем ноутбуке, диалогах Keychain без GUI и OAuth, недоступном по одному SSH. Сменить маршрутизацию и не запустить Gateway локально — дороже, чем ошибиться с моделью. Прежде чем покупать железо, проверьте пары основная/резерв по VNC на арендованном удалённом Mac — 7×24 и графическая приёмка надёжнее слепой покупки недельного лидера.

Если вы еженедельно следите за OpenRouter и держите Agents на macOS постоянно, VNCMac даёт физические узлы Mac mini: кнопка ниже ведёт на страницу тарифов, обзор — на главную.