OpenClaw 2026年4月20日 約 16 分 モデルルーティング VNC

2026 OpenClaw マルチモデルルーティングとコスト最適化
openclaw models から Gateway・VNC 検収へ

主系・順序付きフォールバック・課金メトリクス・GUI セッションのチェック表

OpenClaw マルチモデルルーティングとコスト最適化

すでに OpenClaw を本番運用できているが、請求とレイテンシの両方に圧を感じ始めたチームに向けた記事です。根本原因はしばしば「もっと大きいモデルが必要」ではなく、監査可能な主系+順序付きフォールバックが未整備なこと、そして openclaw models が示す ID と Gateway ログ上の実リクエストが一致していないことにあります。本文では痛みのチェックリスト、意思決定用のマトリクス、8 ステップの Runbook、レビューに貼れる四つの結論、そして Gateway と同一 macOS ユーザーで行う VNC コンソール検収表を提示します。遅延が検索やコンテキスト肥大の匂いがする場合は検証可能なメモリ(Memory Palace)、チャネル負荷はマルチチャネル Gateway、Breaking 後の整合はv2026.4.5 アップグレードと doctor、無言失敗は無応答の切り分けとあわせて読むと、モデル以外の要因を先に潰せます。

01

痛みの分解:すべてをフラッグシップへ上げるとコストだけが増える理由

モデルルーティングは、外部 API のレート制限・リージョンエンドポイント・ツール連鎖の出力肥大・空応答といった揺らぎを、ソフトウェア境界で吸収する設計です。単一の最強ラインに寄せると、その揺らぎが単一障害点になります。429 が出たあと同一プロバイダへ無限リトライする構成は、ユーザーからはランダムフリーズに見え、ログではリトライ嵐として現れます。

請求の驚きは次元不足から生じます。チャネル種別や Heartbeat プローブごとの内訳がなければ、トラフィック増とモデル単価のどちらが効いているか議論だけが空転します。ツール多めのセッションでは、往復回数と中間出力のボリュームが支配的になりやすく、本文と合わせてツール実行失敗のログ切り分けも参照してください。

openclaw models の一覧と手書き JSON のエイリアスが食い違うと、チケットは「名前の話」で止まります。ステージングで一行プローブを打ち、Gateway が実際に送った model id の行をそのまま貼るルールを決めてください。

  1. 01

    説明できない支出:チャネルとタスク種別のタグがないと、Heartbeat やプラグイン起因の肥大が見えません。

  2. 02

    429 とタイムアウトの雪崩:順序付きフォールバックがないと同一クォータへ再試行が集中します。

  3. 03

    品質とコストの逆転:計画・要約・最終回答をすべて最上位モデルへ載せても、誤り率が必ずしも下がりません。

  4. 04

    エイリアスドリフト:CLI と JSON が一致しないと切り分けが前に進みません。

  5. 05

    コンプライアンス:自動クロスリージョンはデータ所在地を壊し得ます。

  6. 06

    SSH のみの死角:WebSocket の半失敗や TLS、権限シートは tail だけでは欠落します。

02

意思決定マトリクス:主系、フォールバック、手動エスカレーション、自動禁止の境界

症状から第一動作を選び、そのあとでモデルサイズを触ります。レイテンシがプロバイダエラーではなく検索・コンテキストに相関するなら、まず Memory Palace 側のマトリクスを確認してください。

シグナル / シナリオ推奨次善よくある誤読
ピーク時 429同一所在地クラス内の順序付きフォールバック、並列度の一時低下オフピークのバッチ、短いキャッシュ同一 model id への無限リトライ
長いツールチェーン計画と最終回答で段を分けるテンプレ短縮、ステップ上限全ホップを最上位へ
大量・低感度チャット既定を小型主系に、人手エスカレーションを明示チャネル別 override全トラフィックを最大モデルへ
金融・PIIクロスリージョン自動フォールバック禁止、ホワイトリスト主系復旧までキュー可用性のために所在地を犠牲
アップグレード後の文字列破損openclaw doctor と models の再スキャンリリースノートのフィールド名差分再起動だけで文字列未確認

ルーティングはポリシー:誰がどこへ落ちてよいかと、どう証明するかを先に書く。

03

8 ステップ Runbook:モデル棚卸しから再現可能なフォールバック訓練まで

順序は意図的です。まず名前を揃え、次にチェーンを書き換え、最後に同一プローブで前後比較します。ゼロ番目の実務ステップは常にバージョンと doctor です。2026.x 系の Breaking でフィールド名が変わると、先月まで正しかった文字列が静かに壊れます。変更チケットには model ルート、auth プロファイル、gateway worker に関する doctor の行をそのまま貼り、ロールバックの紙の道しるべにしてください。

openclaw models 実行時は、プロバイダ接頭辞、安定した model id、組織で標準化したエイリアスをキャプチャします。ステージングで最小一行の完了を打ち、Gateway ログに出る外向き model id と diff します。ここが揃うまでフォールバック順の議論をしても訓練は嘘になります。

フォールバックは集合ではなく順序付き配列として設計します。まず同一リージョン・同一請求主体、コンプライアンスが許す範囲でのみプロバイダを跨ぎます。編集後は配布物の手順に従い gateway を再起動し、直後にプローブを再実行します。プロセスが古いままだと「ファイルは直したのに挙動は昔」の偽陽性が出ます。

  1. 01

    バージョンと doctor:openclaw --versionopenclaw doctor。model 関連の警告をチケットへ。

  2. 02

    棚卸し:openclaw models と利用可能な help フラグ。プローブログ行との突合。

  3. 03

    主系:インストールの正規ツリーで primary を設定(多くの構成では agents.defaults.model 配下)。

  4. 04

    順序付きフォールバック:fallbacks に所在地タグ。まずイントラリージョン。

  5. 05

    チャネル方針:騒がしいチャネルへ override とレート。マルチチャネル記事参照。

  6. 06

    ベースラインプローブ:ツール多めを含む 2〜3 固定プロンプト。TTFB、合計時間、トークン、解決 model id。変更前後で各 2 回。

  7. 07

    ステージングでの故障注入:主系キーを一時失効させ順序を確認。本番では読み取り中心の検証に。

  8. 08

    監査フィールド:チケットに model チェーン、リージョン、429 回数、フォールバック理由コード。SecretRef 方針と併記。

json
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "openrouter/anthropic/claude-3.7-sonnet",
        "fallbacks": [
          "openrouter/google/gemini-2.0-flash-001",
          "anthropic/claude-3-5-haiku-latest"
        ]
      }
    }
  }
}

JSON は形の例示です。実フィールド名とマージ規則はインストール済みバージョンと doctor の実出力に従ってください。複数断片を重ねる場合は、レビュー対象を「ファイルの一部」ではなく「実効ツリー」にしてください。

i

注:ルーティング変更後は gateway を再起動し、数分以内にプローブを流してください。

04

レビューに貼れる四つの結論(環境のヒストグラムで数値を置き換えてください)

手触りの主張の代わりに、貼り付け可能な四文とログ断片を添付します。法務が越境を問うとき、完了ごとの解決 model id がログに残っていなければ説明できません。

  • 結論 1:429 カウントとレイテンシが同一時間窓で相関するなら、まず並列度とフォールバック順を調整し、全体会話を一律グレードアップしない。
  • 結論 2:プローブの解決 id が設定と違うなら、エイリアス・マージ順・環境変数上書きを疑う。
  • 結論 3:ツール多めの課金は往復と中間出力で決まる。テンプレ圧縮の方が安上がりなことが多い。
  • 結論 4:借用ノードでワーカーとメモリが逼迫するとキューイングが増え「モデルが遅い」に見える。アクティビティモニタを先に見る。
!

警告:規制ワークロードでクロスリージョン自動フォールバックを有効化しない。書面承認と明示ホワイトリストが先です。

05

リモート Mac:Gateway と同一ユーザーでの VNC コンソール検収

ブラウザの開発者ツールは WebSocket の再接続、CORS、キャッシュ由来の半失敗を示します。macOS のプライバシーは、想定している Gateway バイナリのパスと実際に許可されたパスが一致するかを確認するのに必須です。SSH だけで JSON を編集し、対話セッションを開かない運用は、権限と TLS のズレを見逃しやすくなります。

共有レンタルノードでは「誰がルーティング JSON を編集し、誰が VNC チェックリストに署名するか」を Runbook に書いておくと、ステージング用キーへ静かに流れたトラフィックを追う時間を節約できます。

検収手順合格基準
ネットワーク429 / model / fallback をフィルタ。各ダウングレードに理由コード。無限リトライなし。
WebSocket / SSE再接続とハートビート間隔を確認。切断から回復。Heartbeat 設定と整合。
プロキシと DNSブラウザのプロキシと CLI DNS を許可範囲で照合。出口のブレなし。
キーチェーン対応プライバシー設定で Gateway パスを確認。doctor と一致。変更後は再起動。
リソース余裕プローブ中のアクティビティモニタ。スワップ急増なし。ディスク空きが安全域以上。
関連記事

vncmac.com の公開ブログ

第 2 節から第 5 節と併読すると切り分けが速くなります。

FAQ

よくある質問

チャネルとタスク種別で分割し、低リスクを小型主系へ。変更は Gateway のトークンとレイテンシのヒストグラムで証明します。

はい。各ホップにリージョンとベンダーをタグ付けし、機微ではクロスリージョン自動を禁止。完了ごとの model チェーンをログに残します。

開発者ツールは WebSocket と CORS。プライバシーはバイナリパス。tail だけでは半失敗が欠落します。

結語

マルチモデルルーティングは、サプライヤ揺らぎを設定面へ写します。openclaw models で名前を揃え、primary と順序付き fallbacks を書き、Gateway ログに証拠を残します。SSH だけで JSON を触り、Gateway ユーザーでコンソールを開かない運用は、権限・TLS・WebSocket の半失敗を見逃しがちです。

常時稼働の物理 Mac はスリープ方針と更新窓、電気・減価償却のコストがあります。スペック不足のローカル機はワーカー不足でキューイングが増え、モデルが遅いように見えます。VNC で突合せ可能なリモート Mac はベースイメージと稼働率をプロバイダに任せつつ、ルーティング方針と秘密は手元に残せ、平均復旧時間を短く保ちやすくなります。

ハード投資を抑えつつ本文第 5 節の検収を Gateway と同じマシンで行いたい場合は、VNCMac でクラウド Mac をご利用ください。主ボタンは購入ページ、プラン比較はトップへ。