AI ハードウェア 2026年6月25日 約 18 分 OpenAI Jalapeño

OpenAI × Broadcom
初の自社 AI チップ Jalapeño 発表

推論コスト最大50%削減 · TSMC 3nm · 9か月テープアウト · 競争構図 · 展開ロードマップ

OpenAI と Broadcom が共同発表した Jalapeño カスタム AI 推論チップ

2026 年 6 月 24 日、OpenAI と Broadcom(ブロードコム)は、LLM 推論専用のカスタム ASIC Jalapeño を共同で発表しました。主流の AI GPU と比べ推論コストを約 50% 削減できるとされ、ワットあたり性能も現行 SoTA を大きく上回ると謳われています。製造は TSMC の 3nm プロセスで、年内には Microsoft Azure などのパートナーデータセンターへ初回展開が予定されています。本稿では自社チップ化の背景、技術アーキテクチャ、性能データとその注意点、9 か月の開発サイクル、サプライチェーン、2026/2027/2029 の展開計画(10GW 目標)、エヌビディアとの競争、業界への波及、キーパーソン、タイムライン、FAQ までを網羅し、開発者が VNCMac リモート Mac で Codex / OpenClaw などの Agent ワークフローを検収する方法にも触れます。

01

背景:OpenAI が自社チップに踏み切った理由

OpenAI は世界最大級の GPU 消費企業のひとつです。ChatGPT への質問が飛ぶたびに、サーバー群は推論(Inference)——入力に基づき回答を生成する処理——で大量の計算資源を消費します。GPT-4 や GPT-5 系列の能力向上に伴い、推論コストは収益化の最大の重石となっています。

これまで OpenAI の推論・学習はほぼ全面的にエヌビディア GPU に依存してきました。H100、H200、Blackwell シリーズは強力ですが、汎用アクセラレータであり、LLM 推論に特化した設計ではありません。同質化した LLM ワークロードでは、相当部分の演算が実質的な無駄遣いになります。たとえば言えば、エヌビディア GPU はスイスアーミーナイフ、Jalapeño は外科用メスという関係です。

競合各社はすでに自社シリコンを展開

企業自社チップ用途
GoogleTPU(Tensor Processing Unit)学習 + 推論
AmazonTrainium(学習)/ Inferentia(推論)学習 + 推論
MicrosoftMaia 100推論
MetaMTIA推論
OpenAIJalapeño(2026)推論

大手の中では最も遅い参入ですが、設計からテープアウトまで 9 か月という驚異的なスピードで、高性能先端半導体分野における ASIC 開発としては史上最速クラスと主張されています。

02

Jalapeño とは何か:技術の中身

2.1 GPU ではなく ASIC

ASIC(Application-Specific Integrated Circuit、用途特化型集積回路)は、ひとつの仕事——ここでは LLM 推論——だけを行うチップです。ゲームも学習も汎用計算も担いません。その特化ゆえに、担当領域では極めて高い効率を発揮します。

「Jalapeño は白紙から LLM 推論のために設計され、最先端モデルのカーネル実行、メモリ移動、ネットワーク通信、サービス形態に関する深い知見を組み込んでいる。」—— OpenAI ハードウェア責任者 Richard Ho

2.2 アーキテクチャの要点

  1. 01

    ブランクスレート設計:既存アーキテクチャの改修ではなく、現代 LLM 推論を起点に再設計。各判断は Transformer の演算パターンに最適化されています。

  2. 02

    データ移動の最小化:推論のボトルネックは演算力よりメモリ帯域であることが多く、Jalapeño はメモリと演算ユニット間の無駄な転送を削減する構造を採用しています。

  3. 03

    計算・メモリ・ネットワークのバランス:実際の LLM 負荷特性に合わせた専用チューニングで、理論ピークに近い利用率を狙います。

  4. 04

    Broadcom Tomahawk によるクラスタ間接続:大規模クラスタ展開時のノード間通信を強化し、マルチカード協調による超大規模モデル推論を支えます。

  5. 05

    Celestica による基板・ラック統合:EMS である Celestica がサーバー基板・ラックシステムへの実装と量産体制を担います。

2.3 製造プロセスとラボ検証

  • 製造:TSMC(台湾セミコンダクター)3nm(Apple M4 やエヌビディア Blackwell と同世代)
  • ラボ稼働モデル:エンジニアリングサンプルは OpenAI ラボで目標周波数・消費電力で稼働確認済み。GPT-5.3-Codex-Spark——コーディング向け旗艦推論モデルのひとつ——も含まれます
03

性能とコスト:主要データと注意点

注意:以下は Broadcom CEO ホック・タンおよび OpenAI 公式発表に基づく初期試験結果です。正式な技術レポートは数か月後の公表予定であり、第三者による独立ベンチマークは未実施です。あくまで「公式自社試験値」として読む必要があります。

指標Jalapeño(初期試験)比較基準
推論コスト削減約 50%現行主流 AI GPU 比
ワットあたり性能現行 SoTA を大幅に上回るOpenAI 公式声明
絶対性能エヌビディア Blackwell・Google TPU と同等Broadcom CEO(Reuters 報道)
熱特性想定を上回る良好さOpenAI 内部試験

ホック・タンは Bloomberg のインタビューで「これまでのところ、Jalapeño は典型的な AI GPU と比べ約 50% のコスト削減を示している」と述べました。OpenAI 共同創業者兼社長の Greg Brockman は「Jalapeño は初期設計からテープアウトまで 9 か月。設計・最適化の一部には OpenAI 自身の AI モデルも使った」と補足しています。

「50%」は現時点では Broadcom 側の初期ラボデータです。本番での実効値は、① OpenAI の完全技術レポート、② Microsoft などパートナーのデータセンター実装、③ 第三者ベンチマークのいずれかが揃うまで待つ必要があります。

04

開発プロセス:9 か月という史上最速クラス

Jalapeño は初期設計から製造テープアウトまでわずか 9 か月。OpenAI と Broadcom は、これを高性能先端半導体における ASIC 開発として史上最速クラスと位置づけています。

  1. 01

    ソフト・ハードの深い共同開発:モデルチームとチップチームが並行して要件を詰め、従来型 ASIC で起きがちな「ハード側がソフト要件を推測する」手戻りを抑えました。

  2. 02

    AI 支援チップ設計:OpenAI の AI モデルが設計判断・最適化の一部を加速(VentureBeat は関係者の話として前世代 OpenAI モデルの利用を報じています)。

  3. 03

    Broadcom の成熟 IP 資産:チップ実装・ネットワークなど再利用可能な IP が豊富で、論理設計から物理実装までの期間を短縮しました。

05

サプライチェーンとパートナー

役割企業担当内容
チップアーキテクチャOpenAILLM 推論最適化、フルスタック設計
シリコン実装・ネットワークBroadcom実装、Tomahawk ネットワーク、量産支援
ファウンドリTSMC3nm 製造
システム統合Celestica基板・ラック・サーバー統合、量産
初回展開先Microsoft Azureデータセンター展開(年内開始)
06

展開計画とビジネスロードマップ

短期(2026 年末)

  • 初回サンプルは OpenAI ラボで試験中
  • 年内に Microsoft ほかパートナーデータセンターへ商用展開
  • ChatGPT、Codex、API など OpenAI 内部推論を最優先

中期(2027 年)

  • 大規模量産により実際の推論処理量が大幅増
  • Broadcom CEO は展開規模が以前予測の 1.3 GW を上回ると見込む
  • 「現行および将来の LLM 全体のため」という公式説明から、外部 AI 企業への開放も視野

長期(2029 年まで)

  • OpenAI の目標:自社チップで 10 GW の算力を支える(原子力発電所約 10 基分の電力規模)
  • 複数世代のロードマップが計画済み。次世代は 2028 年頃、その後は年次イテレーション
  • 将来的には学習チップへの拡張も検討(現行は推論のみ)
07

競争構図:エヌビディアの堀はまだ深いか

Jalapeño でエヌビディアを「置き換え」られるか——当面は No

  1. 01

    推論のみ、学習は対象外:最先端モデルの学習は依然としてエヌビディア GPU 依存が強い。2026 年 2 月にはエヌビディアが OpenAI に 300 億ドルを直接投資し、戦略的結びつきは極めて深い。

  2. 02

    CUDA ソフトウェアエコシステム:十数年かけて築いた開発者基盤は最大の堀であり、Jalapeño では代替できません。

  3. 03

    柔軟性の限界:ASIC は高度に特化するため、LLM アーキテクチャが根本的に変わった場合の適応コストは高くなります。

戦略的意義:「供給分散と交渉力」

Jalapeño が OpenAI 推論負荷の 20〜30% だけを担っても、実コスト削減とエヌビディアへの調達価格交渉力、単一ベンダー依存の回避という効果は大きいです。Google、Amazon、Microsoft と同様、「エヌビディアを捨てる」のではなく「完全依存をやめる」という戦略です。

「誰もエヌビディアに縛られたままにはいたくない。」—— Quilter Cheviot グローバルテック研究責任者 Ben Barringer

エヌビディアと Broadcom の動き

エヌビディアの強みは Vera Rubin プラットフォーム、CUDA エコシステム、OpenAI への 300 億ドル投資による結びつき——競合でありながら深い利益共同体でもあります。一方 Broadcom は Google(TPU v5/v6)、Meta(MTIA)、OpenAI(Jalapeño)向けカスタム ASIC を手がける「AI カスタムチップ界のファウンドリ王」へと台頭しています。2026 年前半の Broadcom 株価は年初比約 18% 上昇、2022 年末からの累計は約 7 倍に達しています。

08

AI 業界への波及効果

  1. 01

    推論経済学がビジネスモデルを再編:50% 削減が本番で実証されれば ChatGPT API コストはさらに下がり、OpenAI の黒字化路線が明確化。「AI 価格戦」の下限も押し下げられます。

  2. 02

    「フルスタック AI 企業」が新標準に:チップ設計からカーネル、メモリ、ネットワーク、スケジューリング、デプロイ、プロダクト体験まで内製——競争軸は「どのモデルが優れているか」から「フルスタック効率がどれだけ高いか」へシフトします。

  3. 03

    半導体勢力図の再編加速:勝者側には Broadcom、TSMC、SK hynix / Samsung(HBM)など。推論シェアを奪われる可能性があるのはエヌビディアや AMD です。

09

キーパーソン

氏名役職本件での役割
Greg BrockmanOpenAI 共同創業者・社長公開発表、「フルスタック基盤戦略」の位置づけ
Richard HoOpenAI ハードウェア責任者技術アーキテクチャのリード
Hock Tan(ホック・タン)Broadcom CEOBlackwell 並み性能・50% コスト削減を公言
Sam AltmanOpenAI CEO算力を自社で握る全体戦略の推進(過去に公開発言)
10

タイムライン

timeline
2025年10月  →  OpenAI と Broadcom がカスタムチップ共同開発を正式発表
2026年2月   →  エヌビディアが OpenAI に 300 億ドル直接投資(Vera Rubin 算力合意を含む)
2026年6月24日 →  Jalapeño チップを公開、エンジニアリングサンプルがラボ稼働
2026年末     →  初回商用展開(Microsoft Azure ほかパートナー DC)
2027年       →  大規模量産、展開規模 1.3 GW 超見込み
2028年(予定)→  第2世代チップ投入
2029年(目標)→  自社チップで 10 GW 算力を支える
FAQ

よくある質問

現時点ではいいえ。LLM 推論専用で学習には使えません。学習領域ではエヌビディアの地位は当面揺るぎず、両者は補完関係です。

Broadcom CEO が Bloomberg インタビューで公表した初期ラボ試験の数値です。第三者検証は未実施で、正式レポートは数か月後の見込みです。慎重に読む必要があります。

本番でコスト削減が実証されれば、ChatGPT / API の料金低下や応答高速化が期待できます。長期的には AI サービスがより安価で普及しやすくなります。

公式の命名理由は未公表です。OpenAI には食べ物名でプロジェクトを呼ぶ慣習があり、性能や市場への刺激的インパクトを示唆していると見る向きもあります。

「現行および将来の LLM 全体のために設計した」という公式説明から、将来的な外部提供を示唆しています。ただし当面は OpenAI 自身の需要が最優先です。

複数世代のロードマップが計画済みで、次世代は 2028 年頃の投入が見込まれ、その後は年次でイテレーションする方針です。

発表直後の株価反応は限定的でした。学習分野での優位は当面維持されるとの見方が主流ですが、大口顧客の自社チップ化は長期的な構造的圧力要因です。

おわりに

Jalapeño はエヌビディア覇権を終わらせる銀の弾丸ではありません。しかし実在し、ラボで GPT-5.3-Codex-Spark を稼働させており、「AI 企業が単に最高入札者から算力を買う時代」が終わりつつある象徴でもあります。OpenAI は Google、Amazon、Microsoft、Meta の自社シリコン行列に加わり——完全な置き換えではなく、レバレッジ獲得・コスト削減・フルスタック掌握を目指しています。50% という数字が本番で立証されれば、AI 経済学に意味のある変化が生じます。

開発者への直接的な影響は、Codex / ChatGPT API がより安く速くなる可能性——一方で、Mac 上でのコーディング、Xcode 実行、OpenClaw Agent デプロイというワークロードは消えません。フルスタック AI 時代は「クラウド推論のコスト最適化」と「ローカル/リモート Mac 開発環境」を二つの並行レーンに分けます。前者は Jalapeño たちが担い、後者は Apple Silicon とグラフィカルセッションが引き続き必要です。Windows/Linux を主力にしつつ Codex Spark や OpenClaw の macOS GUI 境界を検収するなら、VNCMac リモート Mac + VNC が最短ルートです——下のボタンから M4 ノードをすぐ開通できます。