推論コスト最大50%削減 · TSMC 3nm · 9か月テープアウト · 競争構図 · 展開ロードマップ
2026 年 6 月 24 日、OpenAI と Broadcom(ブロードコム)は、LLM 推論専用のカスタム ASIC Jalapeño を共同で発表しました。主流の AI GPU と比べ推論コストを約 50% 削減できるとされ、ワットあたり性能も現行 SoTA を大きく上回ると謳われています。製造は TSMC の 3nm プロセスで、年内には Microsoft Azure などのパートナーデータセンターへ初回展開が予定されています。本稿では自社チップ化の背景、技術アーキテクチャ、性能データとその注意点、9 か月の開発サイクル、サプライチェーン、2026/2027/2029 の展開計画(10GW 目標)、エヌビディアとの競争、業界への波及、キーパーソン、タイムライン、FAQ までを網羅し、開発者が VNCMac リモート Mac で Codex / OpenClaw などの Agent ワークフローを検収する方法にも触れます。
OpenAI は世界最大級の GPU 消費企業のひとつです。ChatGPT への質問が飛ぶたびに、サーバー群は推論(Inference)——入力に基づき回答を生成する処理——で大量の計算資源を消費します。GPT-4 や GPT-5 系列の能力向上に伴い、推論コストは収益化の最大の重石となっています。
これまで OpenAI の推論・学習はほぼ全面的にエヌビディア GPU に依存してきました。H100、H200、Blackwell シリーズは強力ですが、汎用アクセラレータであり、LLM 推論に特化した設計ではありません。同質化した LLM ワークロードでは、相当部分の演算が実質的な無駄遣いになります。たとえば言えば、エヌビディア GPU はスイスアーミーナイフ、Jalapeño は外科用メスという関係です。
| 企業 | 自社チップ | 用途 |
|---|---|---|
| TPU(Tensor Processing Unit) | 学習 + 推論 | |
| Amazon | Trainium(学習)/ Inferentia(推論) | 学習 + 推論 |
| Microsoft | Maia 100 | 推論 |
| Meta | MTIA | 推論 |
| OpenAI | Jalapeño(2026) | 推論 |
大手の中では最も遅い参入ですが、設計からテープアウトまで 9 か月という驚異的なスピードで、高性能先端半導体分野における ASIC 開発としては史上最速クラスと主張されています。
ASIC(Application-Specific Integrated Circuit、用途特化型集積回路)は、ひとつの仕事——ここでは LLM 推論——だけを行うチップです。ゲームも学習も汎用計算も担いません。その特化ゆえに、担当領域では極めて高い効率を発揮します。
「Jalapeño は白紙から LLM 推論のために設計され、最先端モデルのカーネル実行、メモリ移動、ネットワーク通信、サービス形態に関する深い知見を組み込んでいる。」—— OpenAI ハードウェア責任者 Richard Ho
ブランクスレート設計:既存アーキテクチャの改修ではなく、現代 LLM 推論を起点に再設計。各判断は Transformer の演算パターンに最適化されています。
データ移動の最小化:推論のボトルネックは演算力よりメモリ帯域であることが多く、Jalapeño はメモリと演算ユニット間の無駄な転送を削減する構造を採用しています。
計算・メモリ・ネットワークのバランス:実際の LLM 負荷特性に合わせた専用チューニングで、理論ピークに近い利用率を狙います。
Broadcom Tomahawk によるクラスタ間接続:大規模クラスタ展開時のノード間通信を強化し、マルチカード協調による超大規模モデル推論を支えます。
Celestica による基板・ラック統合:EMS である Celestica がサーバー基板・ラックシステムへの実装と量産体制を担います。
注意:以下は Broadcom CEO ホック・タンおよび OpenAI 公式発表に基づく初期試験結果です。正式な技術レポートは数か月後の公表予定であり、第三者による独立ベンチマークは未実施です。あくまで「公式自社試験値」として読む必要があります。
| 指標 | Jalapeño(初期試験) | 比較基準 |
|---|---|---|
| 推論コスト削減 | 約 50% | 現行主流 AI GPU 比 |
| ワットあたり性能 | 現行 SoTA を大幅に上回る | OpenAI 公式声明 |
| 絶対性能 | エヌビディア Blackwell・Google TPU と同等 | Broadcom CEO(Reuters 報道) |
| 熱特性 | 想定を上回る良好さ | OpenAI 内部試験 |
ホック・タンは Bloomberg のインタビューで「これまでのところ、Jalapeño は典型的な AI GPU と比べ約 50% のコスト削減を示している」と述べました。OpenAI 共同創業者兼社長の Greg Brockman は「Jalapeño は初期設計からテープアウトまで 9 か月。設計・最適化の一部には OpenAI 自身の AI モデルも使った」と補足しています。
「50%」は現時点では Broadcom 側の初期ラボデータです。本番での実効値は、① OpenAI の完全技術レポート、② Microsoft などパートナーのデータセンター実装、③ 第三者ベンチマークのいずれかが揃うまで待つ必要があります。
Jalapeño は初期設計から製造テープアウトまでわずか 9 か月。OpenAI と Broadcom は、これを高性能先端半導体における ASIC 開発として史上最速クラスと位置づけています。
ソフト・ハードの深い共同開発:モデルチームとチップチームが並行して要件を詰め、従来型 ASIC で起きがちな「ハード側がソフト要件を推測する」手戻りを抑えました。
AI 支援チップ設計:OpenAI の AI モデルが設計判断・最適化の一部を加速(VentureBeat は関係者の話として前世代 OpenAI モデルの利用を報じています)。
Broadcom の成熟 IP 資産:チップ実装・ネットワークなど再利用可能な IP が豊富で、論理設計から物理実装までの期間を短縮しました。
| 役割 | 企業 | 担当内容 |
|---|---|---|
| チップアーキテクチャ | OpenAI | LLM 推論最適化、フルスタック設計 |
| シリコン実装・ネットワーク | Broadcom | 実装、Tomahawk ネットワーク、量産支援 |
| ファウンドリ | TSMC | 3nm 製造 |
| システム統合 | Celestica | 基板・ラック・サーバー統合、量産 |
| 初回展開先 | Microsoft Azure | データセンター展開(年内開始) |
推論のみ、学習は対象外:最先端モデルの学習は依然としてエヌビディア GPU 依存が強い。2026 年 2 月にはエヌビディアが OpenAI に 300 億ドルを直接投資し、戦略的結びつきは極めて深い。
CUDA ソフトウェアエコシステム:十数年かけて築いた開発者基盤は最大の堀であり、Jalapeño では代替できません。
柔軟性の限界:ASIC は高度に特化するため、LLM アーキテクチャが根本的に変わった場合の適応コストは高くなります。
Jalapeño が OpenAI 推論負荷の 20〜30% だけを担っても、実コスト削減とエヌビディアへの調達価格交渉力、単一ベンダー依存の回避という効果は大きいです。Google、Amazon、Microsoft と同様、「エヌビディアを捨てる」のではなく「完全依存をやめる」という戦略です。
「誰もエヌビディアに縛られたままにはいたくない。」—— Quilter Cheviot グローバルテック研究責任者 Ben Barringer
エヌビディアの強みは Vera Rubin プラットフォーム、CUDA エコシステム、OpenAI への 300 億ドル投資による結びつき——競合でありながら深い利益共同体でもあります。一方 Broadcom は Google(TPU v5/v6)、Meta(MTIA)、OpenAI(Jalapeño)向けカスタム ASIC を手がける「AI カスタムチップ界のファウンドリ王」へと台頭しています。2026 年前半の Broadcom 株価は年初比約 18% 上昇、2022 年末からの累計は約 7 倍に達しています。
推論経済学がビジネスモデルを再編:50% 削減が本番で実証されれば ChatGPT API コストはさらに下がり、OpenAI の黒字化路線が明確化。「AI 価格戦」の下限も押し下げられます。
「フルスタック AI 企業」が新標準に:チップ設計からカーネル、メモリ、ネットワーク、スケジューリング、デプロイ、プロダクト体験まで内製——競争軸は「どのモデルが優れているか」から「フルスタック効率がどれだけ高いか」へシフトします。
半導体勢力図の再編加速:勝者側には Broadcom、TSMC、SK hynix / Samsung(HBM)など。推論シェアを奪われる可能性があるのはエヌビディアや AMD です。
| 氏名 | 役職 | 本件での役割 |
|---|---|---|
| Greg Brockman | OpenAI 共同創業者・社長 | 公開発表、「フルスタック基盤戦略」の位置づけ |
| Richard Ho | OpenAI ハードウェア責任者 | 技術アーキテクチャのリード |
| Hock Tan(ホック・タン) | Broadcom CEO | Blackwell 並み性能・50% コスト削減を公言 |
| Sam Altman | OpenAI CEO | 算力を自社で握る全体戦略の推進(過去に公開発言) |
2025年10月 → OpenAI と Broadcom がカスタムチップ共同開発を正式発表 2026年2月 → エヌビディアが OpenAI に 300 億ドル直接投資(Vera Rubin 算力合意を含む) 2026年6月24日 → Jalapeño チップを公開、エンジニアリングサンプルがラボ稼働 2026年末 → 初回商用展開(Microsoft Azure ほかパートナー DC) 2027年 → 大規模量産、展開規模 1.3 GW 超見込み 2028年(予定)→ 第2世代チップ投入 2029年(目標)→ 自社チップで 10 GW 算力を支える
現時点ではいいえ。LLM 推論専用で学習には使えません。学習領域ではエヌビディアの地位は当面揺るぎず、両者は補完関係です。
Broadcom CEO が Bloomberg インタビューで公表した初期ラボ試験の数値です。第三者検証は未実施で、正式レポートは数か月後の見込みです。慎重に読む必要があります。
本番でコスト削減が実証されれば、ChatGPT / API の料金低下や応答高速化が期待できます。長期的には AI サービスがより安価で普及しやすくなります。
公式の命名理由は未公表です。OpenAI には食べ物名でプロジェクトを呼ぶ慣習があり、性能や市場への刺激的インパクトを示唆していると見る向きもあります。
「現行および将来の LLM 全体のために設計した」という公式説明から、将来的な外部提供を示唆しています。ただし当面は OpenAI 自身の需要が最優先です。
複数世代のロードマップが計画済みで、次世代は 2028 年頃の投入が見込まれ、その後は年次でイテレーションする方針です。
発表直後の株価反応は限定的でした。学習分野での優位は当面維持されるとの見方が主流ですが、大口顧客の自社チップ化は長期的な構造的圧力要因です。
Jalapeño はエヌビディア覇権を終わらせる銀の弾丸ではありません。しかし実在し、ラボで GPT-5.3-Codex-Spark を稼働させており、「AI 企業が単に最高入札者から算力を買う時代」が終わりつつある象徴でもあります。OpenAI は Google、Amazon、Microsoft、Meta の自社シリコン行列に加わり——完全な置き換えではなく、レバレッジ獲得・コスト削減・フルスタック掌握を目指しています。50% という数字が本番で立証されれば、AI 経済学に意味のある変化が生じます。
開発者への直接的な影響は、Codex / ChatGPT API がより安く速くなる可能性——一方で、Mac 上でのコーディング、Xcode 実行、OpenClaw Agent デプロイというワークロードは消えません。フルスタック AI 時代は「クラウド推論のコスト最適化」と「ローカル/リモート Mac 開発環境」を二つの並行レーンに分けます。前者は Jalapeño たちが担い、後者は Apple Silicon とグラフィカルセッションが引き続き必要です。Windows/Linux を主力にしつつ Codex Spark や OpenClaw の macOS GUI 境界を検収するなら、VNCMac リモート Mac + VNC が最短ルートです——下のボタンから M4 ノードをすぐ開通できます。