Quota-Spickzettel · Gemini / Claude / Copilot / Cursor · APIs · Token-Disziplin · Remote-Mac-CLI
Wer unter Windows entwickelt, aber Gemini CLI, Claude Code oder Cursor ohne weiteres 20-Dollar-Abo nutzen will, unterschätzt im Juni 2026 oft, wie großzügig die kostenlosen Kontingente wirklich sind – sie stehen nur in verstreuten Vendor-Dokumenten. Kurzfassung: OAuth-Anmeldungen plus Registrierungsguthaben bei inländischen APIs decken den Alltag; OpenCode oder OpenClaw mit kostenlosen Schlüsseln halten die monatlichen API-Kosten nahe null. Dieser Leitfaden liefert: eine Vergleichstabelle, Installations- und Modellwechsel-Pfade, API-Verkabelung für China, zehn Token-Sparregeln, eine Entscheidungsmatrix für Remote-Mac und FAQ. Kombinieren Sie ihn mit unserem Agent-Skill-Leitfaden und dem OpenRouter-CLI-Ranking.
In Deutschland und der EU gilt dasselbe Muster: Viele Entwickler zahlen parallel für Cursor Pro, Claude Max und eine API-Flatrate, obwohl Gemini CLI OAuth, Copilot Free und Groq-RPD bereits einen Großteil der Aufgaben abdecken. Der Engpass ist selten das Geld, sondern fehlende Übersicht. Wer die Quotas als Portfolio statt als Einzelabo betrachtet, kann Side-Projects monatelang ohne API-Rechnung betreiben – vorausgesetzt, er vermeidet teure Vollrepo-Scans und richtet Alerts ein, bevor 80 % des Kontingents verbraucht sind.
Stand Juni 2026. Limits ändern sich – immer auf den offiziellen Seiten nachlesen. Googles Gemini-CLI-→-Antigravity-Pivot behandeln wir in unserem Artikel zur Vertrauenskrise.
Die folgende Matrix ist bewusst pragmatisch: Sie misst nicht theoretische Modellqualität, sondern wie viele echte Coding-Sessions Sie pro Monat ohne Kreditkarte fahren können. Für Freelancer mit gemischten Kundenprojekten reicht oft die Kombination Gemini CLI (Overseas) + Copilot Free (IDE) + SiliconFlow (Fallback-API).
| Tool | Kostenloses Kontingent | Bezahltes Konto? | China direkt | Bester Gratis-Hebel |
|---|---|---|---|---|
| Gemini CLI (OAuth) | ~1.000 Anfr./Tag, 60/Min. | Nein | Proxy nötig | Keine Karte, Flash/Pro-Mix |
| Gemini API (AI Studio) | Flash ~1.500/Tag | Nein | Proxy nötig | Pro ~100/Tag |
| Codex CLI | Kostenloses ChatGPT (begrenzt) | Nein | Proxy nötig | GPT-5.x-Codex-Sandbox |
| OpenCode | Tool gratis; API kostenpflichtig | Nein | Mit inländischer API | 75+ Anbieter |
| OpenClaw | Tool gratis | Nein | Mit inländischer API | Gemini-CLI-OAuth wiederverwenden |
| Copilot Free | 2.000 Vervollst. + 50 Premium/Mon. | Nein | Ja | Null-Kosten-Test |
| Copilot Student | Volles Pro (~300 Premium/Mon.) | Studierenden-Verifiz. | Ja | ~10 $/Mon. Wert |
| Cursor Hobby | 2.000 Tab + 50 langsame Premium/Mon. | Nein | Ja | Vollständiger VS-Code-Fork |
| SiliconFlow | ~20 Mio. Registrierungs-Tokens | Nein | Ja | DeepSeek, Qwen, GLM |
| Alibaba Bailian | ~70 Mio. Tokens | Nein | Ja | 70+ Modelle |
Zersplitterte Kontingente: CLI-OAuth, IDE-Gratis-Stufen und API-Registrierungsgeschenke leben in drei Silos – leicht doppelt zu zahlen.
Versteckte Token-Fresser: /init-Vollrepo-Scans in Claude Code oder Codex können ein Monatskontingent in einer Sitzung verbrennen.
Plattform-Reibung: OAuth-Browser-Callbacks, macOS-Schlüsselbund und Seatbelt-Sandboxes scheitern auf reinen SSH- oder Nicht-Mac-Hosts.
Richtlinien-Churn: Googles CLI-Roadmap 2026 erfordert Backup-APIs statt Single-Vendor-Lock-in.
Praktischer Tipp: Legen Sie eine Tabellenkopie in Notion oder Obsidian ab und aktualisieren Sie sie monatlich. Viele Anbieter ändern Quotas still per A/B-Test – wer nur einmal im Jahr nachliest, zahlt unnötig.
Global installieren, gemini ausführen, Sign in with Google wählen. Anmeldedaten werden lokal gecacht; das Tageskontingent setzt sich automatisch zurück. Modelle mit /model wechseln; Nutzung mit /stats model prüfen.
Für europäische Entwickler mit stabiler Leitung ist Gemini CLI oft der erste Anlaufpunkt: Flash für Refactoring-Vorschläge, Pro für Architekturfragen. Planen Sie Sessions morgens UTC, wenn Reset-Zeiten kollidieren – manche Nutzer berichten von Grenzeffekten kurz nach Mitternacht Pacific Time.
npm install -g @google/gemini-cli
gemini
# 1. Sign in with Google
# /model — Modell wechseln
# /stats model — KontingentWarnung: OAuth-Tokens nicht über Drittanbieter-Gateways proxyen – Google verbietet das ausdrücklich.
Rust-basiert mit OS-Sandbox. Kostenloses ChatGPT-OAuth funktioniert begrenzt; aus China realistischerweise SiliconFlow oder ähnlich:
openai_base_url = "https://api.siliconflow.cn/v1"
model = "deepseek-ai/DeepSeek-V3"
sandbox_mode = "workspace-write"
web_search = "disabled"
approval_policy = "on-request"| Dimension | Gemini CLI OAuth | Codex + inländische API |
|---|---|---|
| Tagesobergrenze | ~1.000 Anfragen | Registrierungsguthaben variiert |
| China ohne VPN | Nein | Ja |
| Sandbox | Mäßig | Starker Workspace-Modus |
| Ideal für | Overseas-Netz + Volumen | China + DeepSeek/Qwen |
Wer beide Welten braucht, kann Gemini CLI auf einem gemieteten Mac in der EU laufen lassen und Codex mit SiliconFlow vom Windows-Laptop aus steuern – getrennte Quotas, ein Workflow.
Claude Code braucht Pro/Max oder eine günstige Relay-API. Installation: curl -fsSL https://claude.ai/install.sh | bash. Nie /init auf ganzen Monorepos, wenn Sie nicht zahlen wollen – einzelne Dateien anvisieren.
OpenCode (~146K GitHub-Stars) ist kostenlose Software; kostenlose Keys über /connect einbinden. Einzeiler: curl -fsSL https://opencode.ai/install | bash.
OpenClaw kann Gemini-CLI-OAuth erben: openclaw models auth login --provider google-gemini-cli --set-default – etwa 1.000 kostenlose Tagesaufrufe in Agent-Workflows. OpenClaw-Archiv im Blog-Index.
Der strategische Vorteil offener Agenten: Sie wechseln den Modell-Backend ohne IDE-Migration. Wenn Google die CLI-Policy ändert, bleibt Ihr OpenClaw-Gateway bestehen – nur der Provider-Eintrag in der JSON-Konfiguration wird angepasst.
OpenCode oder OpenClaw installieren; onboard abschließen.
SiliconFlow- oder Bailian-Keys in /connect oder Config-JSON einfügen.
Einfache Tasks an Flash oder DeepSeek-V3; Pro/Claude nur für harte Probleme.
Optional lokale GPU: ollama pull qwen3:8b für unbegrenzte Offline-Inferenz.
OAuth, Berechtigungen und Gateway-UI in einer VNC-macOS-Sitzung validieren – SSH-only blockiert oft.
| Funktion | Copilot Free | Copilot Student | Cursor Hobby |
|---|---|---|---|
| Vervollständigungen | 2.000/Mon. | Pro-Niveau | 2.000 Tab/Mon. |
| Premium-Agent-Aufrufe | 50/Mon. | 300/Mon. | 50 langsam/Mon. |
| Hürde | GitHub-Konto | .edu / Studierendenausweis | Registrierung |
| Studierenden-Bonus | — | Auto-Pro | 1 Jahr Pro via GitHub Education |
Leichte Patches und Exploration passen in die Gratis-Limits; tägliche Agent-Refactors brauchen CLI-Kostenlos-Stufen oder Upgrades. Cursor-Nutzung unter app.cursor.sh/account/usage verfolgen.
Studierende in Deutschland sollten zuerst GitHub Education und Copilot Student prüfen – das Pro-Äquivalent deckt oft mehr ab als Cursor Hobby. Berufstätige ohne .edu-Adresse kombinieren typischerweise Copilot Free (VS Code) mit Gemini CLI (Terminal) und reservieren Cursor nur für Repos, in denen der Agent-Modus einen messbaren Zeitgewinn bringt.
Alle Endpunkte unten funktionieren ohne VPN aus dem chinesischen Festland (Beträge laut Anbieter):
https://api.siliconflow.cn/v1https://dashscope.aliyuncs.com/compatible-mode/v1https://open.bigmodel.cn/api/paas/v4export OPENAI_API_KEY="sk-xxxx"
export OPENAI_BASE_URL="https://api.siliconflow.cn/v1"
export ANTHROPIC_BASE_URL="https://api.siliconflow.cn/v1"
export ANTHROPIC_API_KEY="sk-xxxx"Referenzwerte: SiliconFlow-Registrierung ≈ ¥14 permanentes Guthaben; Bailian ~70 Mio. Tokens (zeitlich begrenztes Paket); Zhipu ~20 Mio. permanent; Groq ~14.400 RPD Gratis-Stufe. Kombiniert läuft ein Solo-Dev 3–6 Monate Side-Projects bei 0 $ API-Kosten – je nach Agent-Tiefe.
Auch für Teams mit Mitgliedern in China und Europa gilt: OpenAI-kompatible Base-URLs in Codex und OpenCode vereinheitlichen die Konfiguration. Ein Schlüssel pro Entwickler, zentral dokumentiert – so vermeiden Sie, dass jemand aus Versehen das teure Anthropic-Direct-Gateway nutzt.
Rücksichtslose /init-Vollrepo-Scans verbieten.
In jedem Prompt explizite Dateipfade nennen.
Standard für Triage: Flash / Flash-Lite.
80-%-Kontingent-Alerts in Provider-Konsolen setzen.
Last auf legitime Registrierungsguthaben verteilen.
Ollama für Embeddings und Mikro-Edits nutzen.
System-Prompts kürzen, Overhead pro Aufruf senken.
OpenRouter-Gratis-Routen scannen: openclaw models scan.
Vendor-Promo-Saisons für Gutscheine beobachten.
24/7-Agenten auf gemietetem Mac statt schlafendem Laptop.
| Szenario | Windows lokal | Gemieteter VNC-Mac |
|---|---|---|
| Claude Code Seatbelt | Nicht verfügbar | Nativ |
| OAuth-Browser-Callback | Oft kaputt | Einmalige GUI-Auth |
| OpenClaw Gateway 24/7 | Schlaf-Risiko | Cloud dauerhaft an |
| iOS / Xcode | Nicht unterstützt | Gleicher Knoten |
Ja per persönlichem Google-OAuth: ~1.000 Anfr./Tag, keine Karte. Tokens nicht über Proxys weiterleiten.
Inländische APIs (SiliconFlow, Bailian, Zhipu) plus OpenCode oder Codex CLI mit OpenAI-kompatiblen Base-URLs.
Für leichte Tab-Vervollständigung und gelegentliche Agent-Aufrufe ja. Schwere Agent-Schleifen brauchen Pro oder Student Pro.
GitHub Education mit .edu oder Studierendenausweis verifizieren. Neue Anmeldungen können ab April 2026 pausiert sein.
Die kostenlose AI-Coding-Stack von Juni 2026 steht auf drei Säulen: Overseas-CLI-OAuth, inländische API-Registrierungsgeschenke und offene Agenten mit eigenen Keys. Quota-Tabelle griffbereit, Vollrepo-/init vermeiden, Routine an Flash – monatelang nahe 0 $ möglich.
Windows-first-Entwickler zahlen eine versteckte Steuer: kein macOS-Seatbelt, kaputte OAuth-Callbacks, Laptop-Schlaf killt Gateway, iOS-Builds auf anderer Maschine. Gratis-Tools auf dem falschen OS kosten Kalenderzeit, nicht nur Abos.
Wer diesen Stack verkabelt und eine stabile macOS-Hülle für OAuth, OpenClaw Gateway und Xcode braucht, kann bei VNCMac physische Mac-Knoten mieten – über den Button unten Preise prüfen und alles in einer echten GUI-Sitzung validieren.