openPangu 2.0 は本当に NVIDIA GPU なしで学習されたのですか？

はい。学習は Huawei Ascend 910B NPU のみで実行され、NVIDIA ハードウェアを一切使わない初のフロンティア級オープン LLM です。

openPangu 2.0 と DeepSeek V4 Pro の違いは？

DeepSeek は生のコーディング・推論（約200B アクティブパラメータ）で優位。openPangu は 512K コンテキスト、主権型/Ascend デプロイ、今後の学習コード全公開で差別化します。

openPangu 2.0 をローカルで動かすには？

最速は Huawei Cloud ModelArts API。セルフホストは GitCode Ascend Tribe から Flash ウェイトを取得し、Ascend 910B または約96GB 統合メモリで inference.py を実行します。

openPangu 2.0 オープンソース | 505B MoE 512K

01

タイムライン：HDC 2026 から GitCode 公開まで

日付	イベント
2026-06-12	HDC 2026 — 余承東（Richard Yu）基調講演で openPangu 2.0 発表
2026-06-30	Flash ウェイト・推論コード・学習オペレータを GitCode 公開
2026年7月（予定）	Pro ウェイトと推論コード
2026年下半期（予定）	事前学習コード、事後学習コード、追加オペレータ

今回の公開が重要な理由

01
輸出規制：米国の A100/H100 規制により「NVIDIA なしではフロンティアモデルは無理」という前提が定着していました — 505B MoE を Ascend で学習したことはその前提に挑戦します。
02
オープン深度：多くのラボはウェイト＋推論のみ公開。Huawei は事前/事後学習コードと Ascend カーネルまで計画しています。
03
ニュース窓：Flash は 6月30日に公開 — 主権型スタックを評価する開発者の関心がピークです。
04
HarmonyOS Agent：HarmonyOS 7 エージェント向けネイティブエンジン。30B エッジモデルは Kirin 搭載端末でオフライン動作します。

02

スペックと 7 つのオープンコンポーネント

バリアント	総パラメータ	アクティブ	スパース性	コンテキスト	状態
Pro	505B	18B	約 28:1	512K	2026年7月予定
Flash	92B	6B	約 15:1	512K	6月30日公開済

目安：512K トークンは長編小説 8 冊分 に相当します。Flash は 92B の知識を持ちながら、トークンあたり 6B パラメータのみを活性化します。

01
モデルアーキテクチャ — 公開済
02
ウェイト（Flash 公開済、Pro は 7 月） — Flash 公開済
03
技術レポート — 公開済
04
推論＋学習オペレータ — 公開済
05
事前学習コード — 2026年下半期
06
事後学習（SFT/RLHF） — 2026年下半期
07
Ascend 学習カーネル — 2026年下半期

03

アーキテクチャと学習上のブレークスルー

mHC ルーティング：Multi-Head Combinatorial エキスパートルーティングで負荷偏りを低減
Muon オプティマイザ：大規模学習の安定性のための二階モーメンタム
ModAttn：512K ウィンドウ向けモジュラーアテンション
DSA+SWA（Flash）：推論効率のための超疎アテンション

指標	値
ハイパーノード学習効率	+30%
512K シーケンススループット	+50%
学習/推論一貫性（MoE）	>99%
Ascend 単卡 vs 主流 OSS	2× スループット
Flash-Int8（W4A8）	メモリ -40%、品質劣化 <10%

04

Ascend スタックと開発者エコシステム

学習は Ascend 910B NPU のみ で実行 — A100/H100 は使用していません。スタックは CANN（CUDA 相当のランタイム）＋ torch_npu。標準 PyTorch に import torch_npu を追加するだけでバックエンドを切り替えられます。デプロイ経路は ModelArts API、GitCode セルフホスト、HarmonyOS ネイティブ統合の 3 本立てです。エッジ向け 30B 埋め込みモデルは Kirin シリコン上で推論速度 +50%、メモリ -20% を報告しています。

05

DeepSeek・Qwen・Kimi との正直な比較

モデル	総量	アクティブ	コンテキスト	ハードウェア	オープン深度
openPangu 2.0 Pro	505B	18B	512K	Ascend	7 コンポーネント
DeepSeek V4 Pro	1.6T	約 200B	128K	NVIDIA	ウェイト＋推論
Qwen 3.7 Max	約 400B+	可変	128K	NVIDIA	学習コード一部
Kimi K2.7	1T	32B	256K	NVIDIA	ウェイト＋推論

DeepSeek が勝つ領域は現時点のコーディングと難解推論です。openPangu が勝つ領域は 512K コンテキスト（競合の最大 4 倍）、NVIDIA 非依存の主権型デプロイ、Ascend 上 2× スループット、今後の学習パイプライン全公開です。Kimi が勝つ領域は MCP 重視の Agent ツールチェーンです。コスト重視のローカル検証は Flash（約 96GB）、7 月以降の長文 RAG は Pro を選ぶのが現実的です。

06

アクセス方法：ModelArts API と GitCode

01
Huawei Cloud に登録
02
ModelArts → AI Gallery → openPangu 2.0 を検索
03
サブスクライブし、API エンドポイントとトークンをコピー
04
Chat Completions を呼び出し（下記 curl）
05
モデル別課金上限と監査ログを設定

ModelArts API

curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{"model":"openpangu-2.0-flash","messages":[{"role":"user","content":"MoE を簡単に説明してください"}],"max_tokens":1024}'

単一 Ascend 910B 上の Flash

python inference.py --model_path ./openPangu-Flash --device npu:0 --context_length 512000 --precision bf16

バリアント	推奨構成	最小構成
Flash	1× Ascend 910B	約 96GB 統合メモリ
Flash-Int8	Atlas A2	約 48GB VRAM
Pro	4+ Ascend 910B	マルチカードクラスタ

07

主権型 AI、ライセンス、HarmonyOS Agent

openPangu License の下では商用利用が許可され、ロイヤリティフリー・非独占です（詳細は GitCode を参照）。戦略面では openPangu は HarmonyOS 7 エージェント（フレームワーク 2.0 で複雑タスク成功率 90% 超）を支えます。2026年下半期に事前学習コードが公開されれば、研究者は Ascend 上でフロンティア MoE パイプラインを再現できる — この規模では極めて稀です。

リンク：GitCode Ascend Tribe · ModelArts · HDC 2026

FAQ

はい — 学習パイプラインは Ascend 910B のみ で、A100/H100 は使用していません。

コーディング・推論は DeepSeek、512K 長文・主権型/Ascend デプロイ・将来の学習コード全公開は openPangu 向きです。

おわりに

openPangu 2.0 は現時点のベンチマーク王者ではありません — コーディングタスクでは DeepSeek が依然リードしています。しかし別の価値を持ちます。NVIDIA 非依存のフルスタックフロンティア MoE で 512K コンテキストと説得力のあるオープンロードマップを備えたモデルです。Flash ウェイトはすでに利用可能です。

macOS 上で openPangu を Claude や DeepSeek と並列ルーティングする場合、GUI OAuth、Keychain、常時稼働ホストが必要になることが多いです。ハードを購入する前に、実画面付き Mac でプライマリ/フォールバックペアを検証してください。VNCMac はマルチモデル Agent ルーティング向けに物理 Mac mini ノードを月単位で提供しています。料金プラン、ホームからご確認ください。

Huawei openPangu 2.0 がオープンソース化NVIDIA GPU 一枚も使わず学習