Скользящие 7 дней · 28,9 трлн в неделю · Китай vs США · парадокс Anthropic · маршрутизация Agent в пять шагов
Если вы выбираете модель для Agent и тонете в скриншотах бенчмарков с презентаций, важнее кто реально вызывается, сколько токенов сжигается за неделю и куда смотрит счёт — это ближе к продакшену, чем лабораторный балл. Вывод: по OpenRouter Rankings (скользящее окно 7 дней) неделя 18–24 мая 2026 дала 28,9 трлн токенов глобально; DeepSeek-V4-Flash лидирует с 3,43T. Китайские модели четвёртую неделю подряд опережают США; у Anthropic — парадокс премии: падающая доля токенов при высокой выручке в долларах. В статье: счёт vs бенчмарк, методика, Top 10, двойная правда вендоров, разворот бенчмарк/рынок, еженедельный трекинг и маршрутизация в пять шагов, приёмка Mac для OpenClaw/Claude Code. См. тренды LLM июня, локальный ds4.
MMLU, HumanEval и SWE-bench отвечают на вопрос: каков предел модели на фиксированных датасетах? OpenRouter как нейтральный API-агрегатор соединяет 300+ моделей от 60+ поставщиков с более чем 8 млн пользователей и обрабатывает около 100 трлн токенов в месяц. Рейтинг считает реальные входящие и исходящие токены, прошедшие через платформу. Потраченные деньги и compute не врут: разработчики голосуют кошельком за скорость, стабильность и цену.
В 2026 году доминируют Agent-workflow. Доля задач программирования выросла с ~11 % в начале 2025 до более 50 % — крупнейший одиночный сценарий. Отчёт OpenRouter / a16z «2025 AI Usage» (100 трлн анонимных метаданных) показывает: балл бенчмарка и доля рынка часто обратно коррелируют. Дорогие флагманы не получают автоматически максимальный трафик; сверхдешёвые модели поглощают batch Agent.
Бенчмарк = потолок: разовые прогоны с фиксированными промптами не отражают цепочки tool-call и длинный reasoning.
Недельные токены = пульс: пять недель роста подряд — реальный спрос, а не маркетинговый всплеск.
Две оси: доля токенов и доля выручки в USD разделяют «короля трафика» и «короля маржи».
Все цифры — с openrouter.ai/rankings. Период — недельный, скользящий 7-дневный throughput токенов, как на платформе. Ключевые измерения: недельный суммарный объём (вход+выход), рейтинг моделей, доли вендоров, выручка USD vs доля токенов.
Окно съёма: 18–24 мая 2026 (на момент публикации — последняя полная неделя на сайте). Позже смотрите live-данные; логика чтения остаётся.
Масштаб: год назад ~2,4 трлн токенов в неделю, сейчас 28,9 трлн — рост примерно в 12 раз за год. ИИ перешёл от пилота к масштабу.
| Показатель | Значение | Изменение |
|---|---|---|
| Глобальный недельный объём | 28,9 трлн токенов | +7,4 % (5-я неделя подряд) |
| Китайские модели | 9,223 трлн токенов | +19,89 % |
| Модели США | 4,93 трлн токенов | +16,27 % |
| Геополитика | Китай четыре недели подряд впереди США | |
Типичные ошибки чтения:
Дневной пик за неделю: рейтинг крутится 7 дней — не смешивать с разовым максимумом.
Игнор «остального мира»: европейский open source и Stealth-модели тоже в потоке.
Устаревшие месячные данные: Hy3 и Owl Alpha могут расти на двузначные % за неделю — маршрутизацию обновлять еженедельно.
Только ранг, без цены: лидеры часто «очень дёшево × очень много throughput», не финальная модель ревью.
| Место | Модель | Вендор | Токены/нед | WoW | Профиль |
|---|---|---|---|---|---|
| 1 | DeepSeek-V4-Flash | DeepSeek (Китай) | 3,43T | +66 % | Agent, минимальная цена |
| 2 | Tencent Hy3 Preview | Tencent (Китай) | 3,07T | +16 % | Новинка, взрывной рост |
| 3 | Claude Sonnet 4.6 | Anthropic (США) | 1,35T | — | 1M контекст, enterprise-код |
| 4 | DeepSeek-V3.2 | DeepSeek (Китай) | 1,31T | — | Дёшево, long tail |
| 5 | Owl Alpha | OpenRouter (stealth) | 1,15T | +29 % | Бесплатный Agent, 1M контекст |
| 6 | Gemini 3 Flash Preview | Google (США) | 1,06T | — | Мультимодал, наука/медицина |
| 7 | DeepSeek-V4-Pro | DeepSeek (Китай) | 1,00T | — | Флагман, тяжёлый вывод |
| 8 | MiniMax M2.7 | MiniMax (Китай) | 806B | — | Длинный контекст, цена |
| 9 | Grok 4.1 Fast | xAI (США) | 721B | — | 2M контекст, силён в праве |
| 10 | Step 3.5 Flash | StepFun (Китай) | 673B | — | Быстро, batch |
Источники: места 1–2 и 5 (недельные токены и WoW) — по National Business Daily об OpenRouter за 18–24 мая 2026. Места 3–4, 6 и 8–10 сверены с публичным рейтингом и отраслевыми разборами. DeepSeek-V4-Pro: 1,00T — из суммы серии 5,74T минус V4-Flash (3,43T) и V3.2 (1,31T). Kimi K2.6 (6-й на прошлой неделе) вышел из top 10 и в таблицу не включён.
V4-Flash, V4-Pro и V3.2 одновременно в top 9. Серия даёт ~5,74 трлн токенов в неделю (+25,9 % WoW) и вторую неделю подряд обгоняет Anthropic и Google по вендору. Цитируемый вывод: Flash несёт объём, Pro — сложные задачи, V3.2 — long tail; продуктовая матрица, не один бестселлер.
| Период | Доля китайских моделей (ок.) |
|---|---|
| Начало 2025 | < 2 % |
| Февраль 2026 | Первая неделя впереди США |
| Май 2026 | ~45 %+, четыре недели лидерства |
У Anthropic ~12 % доли токенов (год назад ~25 %), но ~46 % выручки в USD. Enterprise платит премию за Claude Opus 4.6 и аналоги — объём токенов остаётся долей от DeepSeek Flash. Трафик уходит к эффективности, маржа остаётся у premium closed source.
| Сегмент | Примеры | Недельный профиль | Задачи |
|---|---|---|---|
| Высокая ценность · малый трафик | Claude Opus | Мало токенов, много выручки | Enterprise-reasoning, compliance |
| Середина · стабильный трафик | Gemini Flash | Рост мультимодала | Наука, медицина, текст+изображение |
| Дёшево · высокий трафик | DeepSeek / Hy3 / MiniMax / StepFun | Вершина рейтинга | Agent, код, batch |
Пока каждый пункт SWE-bench попадает в заголовки, прод массово маршрутизирует запросы к Flash около $0,10 / $0,40 за миллион токенов. Причины:
Стоимость важнее максимума: при многократных вызовах Agent исходящие токены доминируют в счёте.
Стабильность важнее удачного ответа: ошибки tool-call и latency важнее разового блеска.
Код — главное поле: более 50 % трафика связано с кодом — вершина рейтинга это отражает.
Цифра для цитирования: DeepSeek-V4-Flash +66 % WoW без недели маркетинга нового SOTA — счёт честнее любого leaderboard.
Инвесторы смотрят на данные типа OpenRouter для коммерциализации ИИ; разработчики — для vendor-neutral маршрутизации; исследования — для геополитики и архитектур; медиа — для ответа «кто реально выигрывает». Объём токенов из техметрики стал коммерческим барометром — обновляется еженедельно, публичен, редко попадает в личные чеклисты. На Mac этот рейтинг стоит читать как еженедельный отчёт, а не как шум после keynote.
Счёт, не keynote: по понедельникам открывать Rankings, сравнивать WoW top 3 со своим расходом OpenRouter.
Маршрут по сценарию: Agent/batch → DeepSeek-V4-Flash; тяжёлый вывод → Claude Opus; мультимодал → Gemini Flash.
Следить за новинками: Hy3 Preview, Owl Alpha — высокий WoW = следующий резервный кандидат.
Бюджет и деградация: в OpenClaw/Claude Code — основная/резервная/ревью-модель и лимит токенов на задачу.
GUI-приёмка на Mac: Gateway, OAuth и Keychain требуют интерфейс macOS — одного SSH мало. VNC на арендованном удалённом Mac, smoke-test 20 минут (см. серию OpenClaw).
Чеклист приёмки: ① закладка Rankings; ② три имени моделей; ③ токены и оценка USD за прошлую неделю; ④ ошибки Agent; ⑤ скрин VNC Gateway 200 — тогда «знание рейтинга» становится операционным.
Top 10, шесть трендов и приёмка Mac в пять шагов.
Читать →openclaw models, стоимость и fallback.
Читать →Agent 7×24 и планирование ресурсов Ollama.
Читать →Бенчмарки измеряют предельные возможности; недельные токены — реальные платежи и маршрутизацию. Сверяйте оба; счёт доказывает массовые вызовы.
Claude Opus на порядки дороже DeepSeek Flash за миллион токенов. Enterprise платит премию; batch Agent уходит к дешёвым моделям — парадокс премии.
DeepSeek, Tencent Hy3, MiniMax: низкие цены API и открытые лицензии для Agent/кода. Неделя 18–24 мая: Китай ~9,22T, США ~4,93T токенов.
Rankings еженедельно; модели и бюджет в OpenClaw/Claude Code; VNC удалённый Mac для Gateway/OAuth. См. раздел 08.
Данные третьей недели мая 2026 показывают: рынок голосует деньгами — китайские open-weight модели меняют глобальную картину токенов через крайнюю экономичность. Важно не только «кто умнее», а кто чаще вызывается — это двигает внедрение. Рост недельного объёма в 12 раз за год делает чтение рейтинга рутиной разработчика, а не темой после презентации.
Для пользователей Mac скрытый счёт часто не в тарифе API, а в засыпающем ноутбуке, диалогах Keychain без GUI и OAuth, недоступном по одному SSH. Сменить маршрутизацию и не запустить Gateway локально — дороже, чем ошибиться с моделью. Прежде чем покупать железо, проверьте пары основная/резерв по VNC на арендованном удалённом Mac — 7×24 и графическая приёмка надёжнее слепой покупки недельного лидера.
Если вы еженедельно следите за OpenRouter и держите Agents на macOS постоянно, VNCMac даёт физические узлы Mac mini: кнопка ниже ведёт на страницу тарифов, обзор — на главную.