505B MoE · 512K コンテキスト · 7 コンポーネント · 導入ガイド · DeepSeek 比較
2026年6月30日、Huawei は HDC 2026 で約束した openPangu-2.0-Flash のウェイト、推論コード、学習オペレータを GitCode 上で公開しました。要点:これは NVIDIA 以外のハードウェアだけで学習された初のフロンティア級オープン LLM であり、学習前コードを含む 7 つのフルスタックオープンコンポーネント を計画している数少ないプロジェクトの一つです。本稿ではタイムライン、mHC/ModAttn アーキテクチャ、競合比較、ModelArts API と GitCode セルフホスト手順、主権型 AI の含意、Mac 側マルチモデルルーティングの検証ポイントを整理します。中国系モデル全体像は OpenRouter 2026年6月ランキング も併読してください。
免責:一部の能力評価はアーキテクチャベースの推定です。独立ベンチマーク公開後に更新します。2026年7月1日掲載。
| 日付 | イベント |
|---|---|
| 2026-06-12 | HDC 2026 — 余承東(Richard Yu)基調講演で openPangu 2.0 発表 |
| 2026-06-30 | Flash ウェイト・推論コード・学習オペレータを GitCode 公開 |
| 2026年7月(予定) | Pro ウェイトと推論コード |
| 2026年下半期(予定) | 事前学習コード、事後学習コード、追加オペレータ |
輸出規制:米国の A100/H100 規制により「NVIDIA なしではフロンティアモデルは無理」という前提が定着していました — 505B MoE を Ascend で学習したことはその前提に挑戦します。
オープン深度:多くのラボはウェイト+推論のみ公開。Huawei は事前/事後学習コードと Ascend カーネルまで計画しています。
ニュース窓:Flash は 6月30日に公開 — 主権型スタックを評価する開発者の関心がピークです。
HarmonyOS Agent:HarmonyOS 7 エージェント向けネイティブエンジン。30B エッジモデルは Kirin 搭載端末でオフライン動作します。
| バリアント | 総パラメータ | アクティブ | スパース性 | コンテキスト | 状態 |
|---|---|---|---|---|---|
| Pro | 505B | 18B | 約 28:1 | 512K | 2026年7月予定 |
| Flash | 92B | 6B | 約 15:1 | 512K | 6月30日公開済 |
目安:512K トークンは長編小説 8 冊分 に相当します。Flash は 92B の知識を持ちながら、トークンあたり 6B パラメータのみを活性化します。
モデルアーキテクチャ — 公開済
ウェイト(Flash 公開済、Pro は 7 月) — Flash 公開済
技術レポート — 公開済
推論+学習オペレータ — 公開済
事前学習コード — 2026年下半期
事後学習(SFT/RLHF) — 2026年下半期
Ascend 学習カーネル — 2026年下半期
| 指標 | 値 |
|---|---|
| ハイパーノード学習効率 | +30% |
| 512K シーケンススループット | +50% |
| 学習/推論一貫性(MoE) | >99% |
| Ascend 単卡 vs 主流 OSS | 2× スループット |
| Flash-Int8(W4A8) | メモリ -40%、品質劣化 <10% |
学習は Ascend 910B NPU のみ で実行 — A100/H100 は使用していません。スタックは CANN(CUDA 相当のランタイム)+ torch_npu。標準 PyTorch に import torch_npu を追加するだけでバックエンドを切り替えられます。デプロイ経路は ModelArts API、GitCode セルフホスト、HarmonyOS ネイティブ統合の 3 本立てです。エッジ向け 30B 埋め込みモデルは Kirin シリコン上で推論速度 +50%、メモリ -20% を報告しています。
| モデル | 総量 | アクティブ | コンテキスト | ハードウェア | オープン深度 |
|---|---|---|---|---|---|
| openPangu 2.0 Pro | 505B | 18B | 512K | Ascend | 7 コンポーネント |
| DeepSeek V4 Pro | 1.6T | 約 200B | 128K | NVIDIA | ウェイト+推論 |
| Qwen 3.7 Max | 約 400B+ | 可変 | 128K | NVIDIA | 学習コード一部 |
| Kimi K2.7 | 1T | 32B | 256K | NVIDIA | ウェイト+推論 |
DeepSeek が勝つ領域は現時点のコーディングと難解推論です。openPangu が勝つ領域は 512K コンテキスト(競合の最大 4 倍)、NVIDIA 非依存の主権型デプロイ、Ascend 上 2× スループット、今後の学習パイプライン全公開です。Kimi が勝つ領域は MCP 重視の Agent ツールチェーンです。コスト重視のローカル検証は Flash(約 96GB)、7 月以降の長文 RAG は Pro を選ぶのが現実的です。
Huawei Cloud に登録
ModelArts → AI Gallery → openPangu 2.0 を検索
サブスクライブし、API エンドポイントとトークンをコピー
Chat Completions を呼び出し(下記 curl)
モデル別課金上限と監査ログを設定
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
-H "Content-Type: application/json" \
-H "X-Auth-Token: ${TOKEN}" \
-d '{"model":"openpangu-2.0-flash","messages":[{"role":"user","content":"MoE を簡単に説明してください"}],"max_tokens":1024}'
python inference.py --model_path ./openPangu-Flash --device npu:0 --context_length 512000 --precision bf16
| バリアント | 推奨構成 | 最小構成 |
|---|---|---|
| Flash | 1× Ascend 910B | 約 96GB 統合メモリ |
| Flash-Int8 | Atlas A2 | 約 48GB VRAM |
| Pro | 4+ Ascend 910B | マルチカードクラスタ |
openPangu License の下では商用利用が許可され、ロイヤリティフリー・非独占です(詳細は GitCode を参照)。戦略面では openPangu は HarmonyOS 7 エージェント(フレームワーク 2.0 で複雑タスク成功率 90% 超)を支えます。2026年下半期に事前学習コードが公開されれば、研究者は Ascend 上でフロンティア MoE パイプラインを再現できる — この規模では極めて稀です。
リンク:GitCode Ascend Tribe · ModelArts · HDC 2026
はい — 学習パイプラインは Ascend 910B のみ で、A100/H100 は使用していません。
コーディング・推論は DeepSeek、512K 長文・主権型/Ascend デプロイ・将来の学習コード全公開は openPangu 向きです。
openPangu 2.0 は現時点のベンチマーク王者ではありません — コーディングタスクでは DeepSeek が依然リードしています。しかし別の価値を持ちます。NVIDIA 非依存のフルスタックフロンティア MoE で 512K コンテキストと説得力のあるオープンロードマップを備えたモデルです。Flash ウェイトはすでに利用可能です。
macOS 上で openPangu を Claude や DeepSeek と並列ルーティングする場合、GUI OAuth、Keychain、常時稼働ホストが必要になることが多いです。ハードを購入する前に、実画面付き Mac でプライマリ/フォールバックペアを検証してください。VNCMac はマルチモデル Agent ルーティング向けに物理 Mac mini ノードを月単位で提供しています。料金プラン、ホームからご確認ください。