オープンソース LLM 2026年7月1日 約 22 分 openPangu Ascend NPU

Huawei openPangu 2.0 がオープンソース化
NVIDIA GPU 一枚も使わず学習

505B MoE · 512K コンテキスト · 7 コンポーネント · 導入ガイド · DeepSeek 比較

Huawei openPangu 2.0 オープンソース MoE 大規模言語モデル Ascend NPU

2026年6月30日、Huawei は HDC 2026 で約束した openPangu-2.0-Flash のウェイト、推論コード、学習オペレータを GitCode 上で公開しました。要点:これは NVIDIA 以外のハードウェアだけで学習された初のフロンティア級オープン LLM であり、学習前コードを含む 7 つのフルスタックオープンコンポーネント を計画している数少ないプロジェクトの一つです。本稿ではタイムライン、mHC/ModAttn アーキテクチャ、競合比較、ModelArts API と GitCode セルフホスト手順、主権型 AI の含意、Mac 側マルチモデルルーティングの検証ポイントを整理します。中国系モデル全体像は OpenRouter 2026年6月ランキング も併読してください。

免責:一部の能力評価はアーキテクチャベースの推定です。独立ベンチマーク公開後に更新します。2026年7月1日掲載。

01

タイムライン:HDC 2026 から GitCode 公開まで

日付イベント
2026-06-12HDC 2026 — 余承東(Richard Yu)基調講演で openPangu 2.0 発表
2026-06-30Flash ウェイト・推論コード・学習オペレータを GitCode 公開
2026年7月(予定)Pro ウェイトと推論コード
2026年下半期(予定)事前学習コード、事後学習コード、追加オペレータ

今回の公開が重要な理由

  1. 01

    輸出規制:米国の A100/H100 規制により「NVIDIA なしではフロンティアモデルは無理」という前提が定着していました — 505B MoE を Ascend で学習したことはその前提に挑戦します。

  2. 02

    オープン深度:多くのラボはウェイト+推論のみ公開。Huawei は事前/事後学習コードと Ascend カーネルまで計画しています。

  3. 03

    ニュース窓:Flash は 6月30日に公開 — 主権型スタックを評価する開発者の関心がピークです。

  4. 04

    HarmonyOS Agent:HarmonyOS 7 エージェント向けネイティブエンジン。30B エッジモデルは Kirin 搭載端末でオフライン動作します。

02

スペックと 7 つのオープンコンポーネント

バリアント総パラメータアクティブスパース性コンテキスト状態
Pro505B18B約 28:1512K2026年7月予定
Flash92B6B約 15:1512K6月30日公開済

目安:512K トークンは長編小説 8 冊分 に相当します。Flash は 92B の知識を持ちながら、トークンあたり 6B パラメータのみを活性化します。

  1. 01

    モデルアーキテクチャ — 公開済

  2. 02

    ウェイト(Flash 公開済、Pro は 7 月) — Flash 公開済

  3. 03

    技術レポート — 公開済

  4. 04

    推論+学習オペレータ — 公開済

  5. 05

    事前学習コード — 2026年下半期

  6. 06

    事後学習(SFT/RLHF) — 2026年下半期

  7. 07

    Ascend 学習カーネル — 2026年下半期

03

アーキテクチャと学習上のブレークスルー

  • mHC ルーティング:Multi-Head Combinatorial エキスパートルーティングで負荷偏りを低減
  • Muon オプティマイザ:大規模学習の安定性のための二階モーメンタム
  • ModAttn:512K ウィンドウ向けモジュラーアテンション
  • DSA+SWA(Flash):推論効率のための超疎アテンション
指標
ハイパーノード学習効率+30%
512K シーケンススループット+50%
学習/推論一貫性(MoE)>99%
Ascend 単卡 vs 主流 OSS2× スループット
Flash-Int8(W4A8)メモリ -40%、品質劣化 <10%
04

Ascend スタックと開発者エコシステム

学習は Ascend 910B NPU のみ で実行 — A100/H100 は使用していません。スタックは CANN(CUDA 相当のランタイム)+ torch_npu。標準 PyTorch に import torch_npu を追加するだけでバックエンドを切り替えられます。デプロイ経路は ModelArts API、GitCode セルフホスト、HarmonyOS ネイティブ統合の 3 本立てです。エッジ向け 30B 埋め込みモデルは Kirin シリコン上で推論速度 +50%、メモリ -20% を報告しています。

05

DeepSeek・Qwen・Kimi との正直な比較

モデル総量アクティブコンテキストハードウェアオープン深度
openPangu 2.0 Pro505B18B512KAscend7 コンポーネント
DeepSeek V4 Pro1.6T約 200B128KNVIDIAウェイト+推論
Qwen 3.7 Max約 400B+可変128KNVIDIA学習コード一部
Kimi K2.71T32B256KNVIDIAウェイト+推論

DeepSeek が勝つ領域は現時点のコーディングと難解推論です。openPangu が勝つ領域は 512K コンテキスト(競合の最大 4 倍)、NVIDIA 非依存の主権型デプロイ、Ascend 上 2× スループット、今後の学習パイプライン全公開です。Kimi が勝つ領域は MCP 重視の Agent ツールチェーンです。コスト重視のローカル検証は Flash(約 96GB)、7 月以降の長文 RAG は Pro を選ぶのが現実的です。

06

アクセス方法:ModelArts API と GitCode

  1. 01

    Huawei Cloud に登録

  2. 02

    ModelArts → AI Gallery → openPangu 2.0 を検索

  3. 03

    サブスクライブし、API エンドポイントとトークンをコピー

  4. 04

    Chat Completions を呼び出し(下記 curl)

  5. 05

    モデル別課金上限と監査ログを設定

ModelArts API
curl -X POST "https://modelarts.${REGION}.myhuaweicloud.com/v1/infers/openpangu-2-flash/chat/completions" \
  -H "Content-Type: application/json" \
  -H "X-Auth-Token: ${TOKEN}" \
  -d '{"model":"openpangu-2.0-flash","messages":[{"role":"user","content":"MoE を簡単に説明してください"}],"max_tokens":1024}'
単一 Ascend 910B 上の Flash
python inference.py --model_path ./openPangu-Flash --device npu:0 --context_length 512000 --precision bf16
バリアント推奨構成最小構成
Flash1× Ascend 910B約 96GB 統合メモリ
Flash-Int8Atlas A2約 48GB VRAM
Pro4+ Ascend 910Bマルチカードクラスタ
07

主権型 AI、ライセンス、HarmonyOS Agent

openPangu License の下では商用利用が許可され、ロイヤリティフリー・非独占です(詳細は GitCode を参照)。戦略面では openPangu は HarmonyOS 7 エージェント(フレームワーク 2.0 で複雑タスク成功率 90% 超)を支えます。2026年下半期に事前学習コードが公開されれば、研究者は Ascend 上でフロンティア MoE パイプラインを再現できる — この規模では極めて稀です。

リンク:GitCode Ascend Tribe · ModelArts · HDC 2026

FAQ

FAQ

はい — 学習パイプラインは Ascend 910B のみ で、A100/H100 は使用していません。

コーディング・推論は DeepSeek、512K 長文主権型/Ascend デプロイ・将来の学習コード全公開は openPangu 向きです。

おわりに

openPangu 2.0 は現時点のベンチマーク王者ではありません — コーディングタスクでは DeepSeek が依然リードしています。しかし別の価値を持ちます。NVIDIA 非依存のフルスタックフロンティア MoE で 512K コンテキストと説得力のあるオープンロードマップを備えたモデルです。Flash ウェイトはすでに利用可能です。

macOS 上で openPangu を Claude や DeepSeek と並列ルーティングする場合、GUI OAuth、Keychain、常時稼働ホストが必要になることが多いです。ハードを購入する前に、実画面付き Mac でプライマリ/フォールバックペアを検証してください。VNCMac はマルチモデル Agent ルーティング向けに物理 Mac mini ノードを月単位で提供しています。料金プランホームからご確認ください。