주 라인·순서형 폴백·과금 메트릭·GUI 세션 콘솔 체크리스트
이미 OpenClaw를 프로덕션에서 돌리고 있지만 청구서와 지연 양쪽에서 압박을 느끼는 팀을 위한 글입니다. 근본 원인은 종종 「더 큰 모델이 필요해서」가 아니라 감사 가능한 주(primary)·순서형 폴백 체인이 없거나, openclaw models에 보이는 ID와 Gateway 로그의 실제 요청 문자열이 어긋나 있기 때문입니다. 여기서는 통증 체크리스트, 의사결정 매트릭스, 8단계 Runbook, 변경 검토용 네 가지 결론, 그리고 Gateway와 동일한 macOS 사용자에서 수행해야 하는 VNC 콘솔 검수표를 제시합니다. 지연이 검색·컨텍스트 비대 냄새가 난다면 검증 가능한 메모리(Memory Palace), 채널 부하는 다채널 Gateway, Breaking 이후 정합은 v2026.4.5 업그레이드·doctor, 무응답은 무응답 분기와 함께 읽으면 모델 외 요인을 먼저 걷어낼 수 있습니다.
모델 라우팅은 외부 API의 속도 제한, 리전 엔드포인트, 도구 연쇄의 출력 팽창, 빈 응답 같은 변동을 소프트웨어 경계에서 흡수하는 설계입니다. 단일 최강 라인에 몰면 그 변동이 단일 장애점이 됩니다. 429 이후 동일 공급자로 무한 재시도하는 구성은 사용자에게는 간헐적 멈춤으로, 로그에는 재시도 폭풍으로 보입니다.
청구서 놀람은 차원 부족에서 옵니다. 채널 종류·Heartbeat 프로브별 분해가 없으면 트래픽 증가와 모델 단가 중 무엇이 기여했는지 논의만 공회전합니다. 도구 비중이 큰 세션은 왕복 횟수와 중간 출력 부피가 지배적이므로 도구 실행 실패·로그 분기도 함께 보세요.
openclaw models 목록과 손으로 쓴 JSON 별칭이 어긋나면 티켓은 「이름 싸움」에서 멈춥니다. 스테이징에서 한 줄 프로브를 치고 Gateway가 실제로 보낸 model id 한 줄을 그대로 붙여 넣는 규칙을 두세요.
설명되지 않는 지출: 채널·작업 태그가 없으면 Heartbeat·플러그인 기인 팽창이 안 보입니다.
429·타임아웃 연쇄: 순서형 폴백이 없으면 동일 쿼터에 재시도가 몰립니다.
품질 대비 비용 역전: 계획·요약·최종 답을 모두 최상위 모델에 올려도 오류율이 반드시 내려가지는 않습니다.
별칭 드리프트: CLI와 JSON이 다르면 분기가 전진하지 않습니다.
컴플라이언스: 자동 크로스리전 폴백은 거주 규칙을 깰 수 있습니다.
SSH 전용 사각지대: WebSocket 반쯤 실패·TLS·권한 시트는 tail만으로는 빠집니다.
증상에서 첫 행동을 고른 뒤에야 모델 크기를 만집니다. 지연이 공급자 오류가 아니라 검색·컨텍스트와 상관이면 먼저 Memory Palace 매트릭스를 확인하세요.
| 신호 / 시나리오 | 선호 | 차선 | 흔한 오독 |
|---|---|---|---|
| 피크 429 | 동일 거주 클래스 내 순서형 폴백, 동시성 일시 하향 | 비피크 배치, 짧은 캐시 | 동일 model id 무한 재시도 |
| 긴 도구 체인 | 계획과 최종 답을 단계 분리 | 템플릿 축소, 스텝 상한 | 모든 홉을 최상위로 |
| 대량·저감도 채팅 | 기본을 작은 주 라인, 명시적 사람 에스컬레이션 | 채널별 override | 전 트래픽을 최대 모델로 |
| 금융·PII | 크로스리전 자동 폴백 금지, 화이트리스트 | 주 라인 복구까지 큐 | 가용성 때문에 거주 포기 |
| 업그레이드 후 문자열 파손 | openclaw doctor와 models 재스캔 | 릴리스 노트 필드명 | 재시작만 하고 문자열 미확인 |
라우팅은 정책: 누가 어디로 떨어질 수 있는지와 어떻게 증명할지를 먼저 씁니다.
순서는 의도적입니다. 먼저 이름을 맞추고, 체인을 고친 다음, 동일 프로브로 전후를 비교합니다. 실무의 0번 단계는 항상 버전과 doctor입니다. 2026.x Breaking으로 필드명이 바뀌면 지난달까지 맞던 문자열도 조용히 깨집니다. 변경 티켓에 model 루트·auth 프로필·gateway worker 관련 doctor 줄을 그대로 붙여 롤백의 종이 흔적을 남기세요.
openclaw models 실행 시 공급자 접두사, 안정 model id, 조직 표준 별칭을 캡처합니다. 스테이징에서 최소 한 줄 완료를 치고 Gateway 로그의 외향 model id와 diff합니다. 여기가 맞기 전까지 폴백 순서 논의는 훈련이 거짓이 됩니다.
폴백은 집합이 아니라 순서 배열로 설계합니다. 먼저 동일 리전·동일 청구 주체, 컴플라이언스가 허하는 범위에서만 공급자를 넘나듭니다. 편집 후 배포본 절차에 따라 gateway를 재시작하고 곧바로 프로브를 다시 실행하세요. 프로세스가 오래되면 「파일은 고쳤는데 동작은 예전」 거짓 양성이 납니다.
버전·doctor: openclaw --version, openclaw doctor. model 관련 경고를 티켓에.
재고 정렬: openclaw models와 지원되는 help 플래그. 프로브 로그 줄과 대조.
주 라인: 설치의 정규 트리에서 primary 설정(대개 agents.defaults.model 아래).
순서형 폴백: fallbacks에 리전 태그. 먼저 인트라리전.
채널 정책: 시끄러운 채널에 override·속도 제한. 다채널 글 참고.
베이스라인 프로브: 도구 많은 케이스를 포함한 2~3개 고정 프롬프트. TTFB, 총 시간, 토큰, 해석된 model id. 변경 전후 각 2회.
스테이징 장애 주입: 주 키를 일시 무효화해 순서 확인. 프로덕션은 읽기 중심 검증으로.
감사 필드: 티켓에 모델 체인·리전·429 횟수·폴백 사유 코드. SecretRef 정책과 병기.
{
"agents": {
"defaults": {
"model": {
"primary": "openrouter/anthropic/claude-3.7-sonnet",
"fallbacks": [
"openrouter/google/gemini-2.0-flash-001",
"anthropic/claude-3-5-haiku-latest"
]
}
}
}
}
JSON은 형태 예시입니다. 실제 필드명·병합 규칙은 설치된 버전과 doctor 출력을 따르세요. 여러 조각을 겹칠 때는 「파일 일부」가 아니라 「실효 트리」를 검토 대상으로 삼으세요.
참고: 라우팅 변경 후 gateway를 재시작하고 수 분 안에 프로브를 돌리세요.
감에 의존한 주장 대신 붙여 넣을 네 문장과 로그 발췌를 첨부합니다. 법무가 국경을 넘었는지 물을 때 완료마다 해석된 model id가 로그에 없으면 설명할 수 없습니다.
경고: 규제 워크로드에서 서면 승인·명시 화이트리스트 없이 크로스리전 자동 폴백을 켜지 마세요.
브라우저 개발자 도구는 WebSocket 재연결, CORS, 캐시에서 오는 반쯤 실패를 보여 줍니다. macOS 개인정보 보호는 생각하는 Gateway 바이너리 경로와 실제로 허용된 경로가 맞는지 확인하는 데 필요합니다. SSH로만 JSON을 고치고 대화 세션을 열지 않으면 권한·TLS 불일치를 놓치기 쉽습니다.
공유 렌탈 노드에서는 「누가 라우팅 JSON을 고치고 누가 VNC 체크리스트에 서명하는가」를 Runbook에 적어 두면 스테이징 키로 조용히 새는 트래픽을 쫓는 시간을 줄입니다.
| 검수 | 방법 | 합격 기준 |
|---|---|---|
| 네트워크 | 429 / model / fallback 필터. | 각 다운그레이드에 사유 코드. 무한 재시도 없음. |
| WebSocket / SSE | 재연결·하트비트 간격 확인. | 끊김에서 회복. Heartbeat 설정과 일치. |
| 프록시·DNS | 브라우저 프록시와 허용 범위의 CLI DNS 대조. | 출구 흔들림 없음. |
| 키체인 매핑 | 개인정보 설정에서 Gateway 경로 확인. | doctor와 일치. 변경 후 재시작. |
| 자원 여유 | 프로브 중 활동 모니터. | 스왑 급증 없음. 디스크 여유가 안전선 이상. |
2~5절과 교차로 읽으면 분기가 빨라집니다.
지연이 검색·컨텍스트 쪽일 때의 매트릭스.
읽기채널별 부하와 override.
읽기Breaking 후 model 필드 정합.
읽기채널·작업 유형으로 나누고 저위험은 작은 주 라인으로. 변경은 Gateway 토큰·지연 히스토그램으로 증명합니다.
예. 각 홉에 리전·벤더 태그, 민감 세션은 크로스리전 자동 금지. 완료마다 모델 체인을 로그에 남깁니다.
개발자 도구는 WebSocket·CORS. 개인정보는 바이너리 경로. tail만으로는 반쯤 실패가 빠집니다.
다중 모델 라우팅은 공급자 변동을 설정 표면으로 옮깁니다. openclaw models로 이름을 맞추고 primary와 순서형 fallbacks를 쓰며 Gateway 로그에 증거를 남깁니다. SSH로만 JSON을 만지고 Gateway 사용자로 콘솔을 열지 않으면 권한·TLS·WebSocket 반쯤 실패를 놓치기 쉽습니다.
상시 가동 물리 Mac은 수면 정책·업데이트 창·전기·감가가 붙습니다. 사양 부족 로컬은 워커 부족으로 큐가 쌓여 모델이 느린 것처럼 보입니다. VNC로 맞출 수 있는 원격 Mac은 베이스 이미지·가동률을 제공자에 맡기고 라우팅 정책과 비밀은 손에 남겨 평균 복구 시간을 짧게 유지하기 쉽습니다.
하드 투자를 줄이면서 본문 5절 검수를 Gateway와 같은 머신에서 하려면 VNCMac으로 클라우드 Mac을 이용하세요. 주 버튼은 구매 페이지, 플랜 비교는 홈으로.