Ollama 로컬 추론 · LaunchAgent 7×24 · Memory Tree · 비용 비교
누가 이 문제를 겪나요? 2026년 OpenClaw(메시지 채널 자율 Agent)와 OpenHuman(Memory Tree 데스크톱 슈퍼 어시스턴트) 모두 Ollama 전 로컬 추론을 지원하지만, 항상 켜져 있는 macOS 호스트가 필요합니다. 노트북은 슬립하고, Linux VPS는 OpenHuman Tauri GUI를 돌리기 어렵고, M4를 직접 구매하면 ₩1,000만 원대 upfront 비용과 배송 대기가 생깁니다. 결론: 전용 물리 Mac mini M4를 임대(SSH + VNC, 약 10분 개통)하는 것이 비용과 경험의 최단 경로입니다. 본문 구성: 선정 이유 → 제품 비교 → M4 스펙 → 노드 검수 → OpenClaw / OpenHuman / Ollama 단계별 설치 → 리소스·비용 → 보안 → FAQ. 구매 vs 임대 결정표, OpenClaw + Ollama 하이브리드 배포와 함께 읽으면 좋습니다.
2026년 AI Agent 경쟁 축은 「어느 클라우드 API가 더 강한가」에서 「지속적·비공개·비용 통제 가능한 실행 환경」으로 이동했습니다. OpenClaw와 OpenHuman 모두 안정 프로세스, 디스크 쓰기, 백그라운드 메시지·데스크톱 이벤트 응답을 전제합니다. 아래 네 가지가 「전용 macOS 호스트」를 사실상 필수로 만듭니다.
7×24 온라인: Telegram / WhatsApp 채널과 OpenHuman 20분 기억 동기화는 뚜껑을 닫지 않고 네트워크가 끊기지 않는 머신을 요구합니다.
macOS 네이티브: LaunchAgent 데몬, TCC 화면 녹화·손쉬운 사용·마이크, 브라우저 CDP——Linux SSH만으로는 권한 계층에서 막히는 경우가 많습니다(능력 경계 대조 참고).
Apple Silicon 추론: 16GB 통합 메모리로 7B–13B를 편하게, M4 Pro 64GB는 70B급 로컬 모델까지. Neural Engine은 Ollama Metal 백엔드와 궁합이 좋습니다.
현금 흐름: M4 일괄 구매는 ₩800만–₩2,500만 upfront. 일·월 임대(VNCMac 약 $19.8/일부터, 월 약 $195.9 수준)는 CapEx를 중단 가능한 OpEx로 바꿔 60–90일 검증에 적합합니다.
참고 수치: 물리 Mac mini M4 유휴 전력은 약 4–6W(7×24 전기료는 GPU 타워보다 훨씬 낮음). 클라우드 Linux + 고급 GPU는 시간당 $2–5가 흔하고, M4에서 13B 로컬 추론은 30–45 tokens/s 수준(7B급, 양자화·냉각에 따라 변동).
둘 다 2026년 오픈소스 Agent 1티어이지만 형태가 다릅니다. 먼저 OpenClaw(CLI + 채널)로 Gateway·Ollama를 검증한 뒤 OpenHuman(GUI + 기억 트리)를 개인 지식 어시스턴트로 올리는 순서를 권장합니다. 하나만 선택해도 됩니다.
| 차원 | OpenClaw (MIT) | OpenHuman (GPL-3.0) |
|---|---|---|
| 형태 | 터미널 + Telegram/WhatsApp/Discord 등 20+ 채널 | Tauri v2 데스크톱, Rust + React 19 |
| 기억 | SOUL / MEMORY 파일 + 플러그인 | Memory Tree, Obsidian vault, 약 20분 도구 동기화 |
| 로컬 AI | Ollama (openclaw onboard에서 제공자 선택) | config.toml의 local_ai.*, Ollama / LM Studio |
| 음성 / 회의 | 플러그인 확장 중심 | 네이티브 STT/TTS, Google Meet 가상 참석(v0.54+ 로컬 음성 강화) |
| 전형 사용자 | 자동화 운영, IM 봇, CLI 파워 유저 | 개인 슈퍼 어시스턴트, Gmail/Notion/Slack 깊은 연동 |
| 런타임 | Node.js ≥ 22(권장 v24) | 설치 스크립트가 네이티브 패키지 설치, 16GB+ RAM 권장 |
임대 Mac mini M4에서는 동일 Ollama(127.0.0.1:11434)를 공유해 모델 중복 다운로드를 피하세요. 동시 실행 시 OLLAMA_MAX_LOADED_MODELS=1과 적절한 OLLAMA_KEEP_ALIVE로 16GB가 두 개 13B 모델에 눌리지 않게 합니다.
| 구성 | 적합 모델 | 듀얼 Agent 권장 | 임대 시나리오 |
|---|---|---|---|
| M4 · 16GB | Qwen2.5 7B, Llama 3.2, Gemma3 1B–4B | OpenClaw 채널 + OpenHuman 경량 로컬 | 개인, PoC, 월 임대 입문 |
| M4 · 24GB | Phi-4 14B, Qwen 14B 양자화 | 13B 하나 + Gateway 상주 가능 | 소규모 팀 기본값 |
| M4 Pro · 48–64GB | 32B–70B 양자화, 다중 모델 로테이션 | 병렬 실험, 로컬 RAG 집중 | 업그레이드 노드, Studio 구매 불필요 |
한국·아시아 사용자는 RTT를 줄이려 홍콩·싱가포르 노드를 우선 검토하고, 로컬 추론에는 Qwen2.5 등 한·중·영 다국어 가중치가 실용적입니다. 민감 업무는 대화를 제3자 API로 보내지 말고 openclaw.json과 OpenHuman 설정에서 기본 모델을 Ollama로 고정하세요.
플랜 페이지에서 리전·M4 메모리·과금 주기를 선택하고 SSH 키·VNC 주소를 저장합니다.
VNC 첫 접속: macOS 로그인 후 시각 자동 동기화 확인(OAuth·인증서에 필수).
Xcode Command Line Tools: xcode-select --install(일부 네이티브 의존성 빌드용).
TCC 사전 준비: 화면 녹화, 손쉬운 사용, 마이크(OpenHuman 음성 / OpenClaw 브라우저 자동화). VNC 권한 체크리스트 참고.
방화벽: OpenClaw Gateway(기본 18789)를 외부에 열 경우 화이트리스트 IP만 허용하거나 역방향 프록시 + HTTPS를 사용하세요.
OpenClaw는 2026년에도 원클릭 설치 스크립트(Node ≥ 22)를 권장합니다.
curl -fsSL https://openclaw.ai/install.sh | bash
openclaw onboard --install-daemon
onboard 마법사는 LLM 제공자(Ollama 선택), Telegram/WhatsApp 바인딩, ~/.openclaw/openclaw.json 작성을 안내합니다. --install-daemon은 LaunchAgent를 등록해 로그인 후 Gateway 자동 기동——임대 노드 7×24에 적합합니다. 여러 버전을 거쳤다면 업그레이드 후 openclaw doctor --fix(2026.4.x+에서 흔함).
최소 Telegram 연동: BotFather에서 봇 생성 → onboard에 token 입력 → 휴대폰에서 /start → VNC에서 OpenClaw 콘솔로 세션 라우팅 확인. 「보냈는데 무응답」이면 무응답 트러블슈팅으로 heartbeat·모델 라우팅을 점검하세요.
보안 강화(프로덕션 전): openclaw security audit --fix, Gateway는 TLS 역프록 없이 127.0.0.1 바인딩을 권장합니다.
OpenHuman 안정 태그 v0.53.22(2026-05-09). 커뮤니티 메인 v0.54.x는 로컬 음성·IDE 브릿지를 강화합니다. macOS 설치:
curl -fsSL https://raw.githubusercontent.com/tinyhumansai/openhuman/main/scripts/install.sh | bash
첫 실행 Onboarding에서 Gmail / Notion / Slack OAuth 연결(VNC 브라우저 로그인이 가장 안정적). 로컬 AI는 기본 꺼짐——사용자 설정 디렉터리 config.toml에서 명시적으로 켭니다.
[local_ai]
runtime_enabled = true
opt_in_confirmed = true
provider = "ollama"
# base_url = "http://127.0.0.1:11434" # 비기본 포트일 때
Memory Tree 활용: Agent가 도구 활동을 자동 수집해 기억 트리에 기록합니다. Obsidian vault로 2차 정리하면 한국어 메모도 관리하기 쉽습니다. v0.54+ 완전 로컬 음성은 마이크 권한과 gemma3:1b 같은 경량 요약 모델 Ollama pull 여부를 확인하세요.
brew install ollama
brew services start ollama
ollama pull qwen2.5:7b
ollama pull llama3.2:latest
# 선택: ollama pull gemma3:4b
장기 Agent는 launchd 환경(~/Library/LaunchAgents 또는 brew services plist)을 조정하세요.
OLLAMA_HOST=127.0.0.1:11434
OLLAMA_KEEP_ALIVE=30m
OLLAMA_MAX_LOADED_MODELS=1
OLLAMA_NUM_PARALLEL=2
OpenClaw는 models.providers.ollama에 모델 ID를 선언하고, OpenHuman은 UI 또는 local_ai.provider로 같은 엔드포인트를 가리킵니다. 리소스 전략: 낮에는 OpenClaw IM 자동화, 밤 배치에 큰 모델이 필요하면 ollama stop으로 통합 메모리를 비우고, OpenHuman 음성 모드와 OpenClaw 브라우저 MCP를 동시에 CPU 풀로 돌리지 마세요.
| 안 | 첫해 현금(규모) | 로컬 13B | 7×24 적합도 |
|---|---|---|---|
| 자체 M4 16GB | 약 ₩800만–₩1,000만 | 가능 | 전기·네트워크·교체 자체 관리 |
| VNCMac 월 임대 | 약 ₩190,000/월 × 실제 개월 | 가능(물리기) | 만료 시 업그레이드·반납, 검증에 적합 |
| 클라우드 GPU | 시간당 $2+, 연간 구매 초과 흔함 | 가능하나 데이터 외부 | macOS GUI / LaunchAgent 경험 없음 |
| 순수 API(로컬 없음) | 토큰 선형 증가 | 불가 | 제3자 경유, 컴플라이언스 어려움 |
세 가지 결론: ① OpenClaw + OpenHuman + Ollama를 90일 시험하면 월 임대 총비용이 유휴 M4 구매보다 낮은 경우가 많습니다. ② 3년 풀타임 Agent·칩 교체 불필요가 확정되면 구매를 재평가. ③ 대화를 로컬 7B/13B로 옮기면 12개월 API 비용이 임대료를 넘을 수 있습니다——Hermes 상주 호스트 글과 같은 논리입니다.
OpenClaw는 openclaw secrets / SecretRef. Telegram token·OAuth는 Git에 올리지 마세요. OpenHuman은 클라우드 구독과 local_ai 공존 가능——민감 티켓은 기본 로컬 모델 처리를 권장합니다.
임대 노드 고정 공인 IP에서는 Gateway 반드시 인증. 기업 egress는 OPENCLAW_PROXY_URL(v2026.4.27 문서 참고).
반납 전 ~/.openclaw, OpenHuman 설정·Obsidian vault, Ollama 모델 목록을 패키징(모델 파일은 재설치 가능, 설정은 잃으면 안 됨).
가능합니다. Ollama는 13B 이하 모델 하나만 상주를 권장하며 피크는 약 12–14GB. 32B+ 병렬은 M4 Pro 48GB/64GB 임대 노드를 선택하세요.
OpenClaw 대부분은 SSH로 가능합니다. OpenHuman 첫 OAuth, macOS 권한, 데스크톱 UI는 VNC가 필요합니다. QR 기반 IM 바인딩도 그래픽 세션이 필요합니다.
Hermes는 Nous 생태·Skill 자기 진화, OpenClaw는 채널 자동화, OpenHuman은 데스크톱 어시스턴트·Memory Tree에 치우칩니다. 하드웨어 요구는 비슷——7×24 macOS——같은 머신 다른 디렉터리로 격리 가능합니다.
brew install node@22 또는 nvm으로 Node 22+ 설치 후 which node가 새 버전을 가리키는지 확인하고 OpenClaw를 재설치하세요.
OpenClaw는 Agent를 매일 쓰는 IM에 연결하고, OpenHuman은 기억과 데스크톱 도구를 이으며, Ollama는 대화를 토큰 과금에서 해방합니다. 진짜 장벽은 명령어가 아니라 7×24 켜 두고 macOS여야 하는 머신입니다.
Mac mini M4 구매는 연중 온라인이 확정된 팀에 맞습니다. 「살까 임대할까」「Linux로 될까」를 아직 비교 중이라면 물리 M4를 먼저 임대해 VNC로 설치·권한을 끝낸 뒤 구매를 판단하는 순서가 시간과 현금 흐름 모두에서 유리합니다. VNCMac은 전용 Mac mini M4, SSH/VNC 전체 접근, 메모리 업그레이드 가능한 임대로 로컬 AI Agent 장주를 upfront 없이 시작할 수 있게 합니다.
Agent 가치는 가동 시간에 쓰입니다——먼저 뚜껑 닫히지 않는 Mac을 주세요. 아래 Mac mini M4 플랜에서 일·월 단위로 노드를 개통하세요.