一般使用者會感受到什麼變化？

如果成本節省驗證成功，ChatGPT 與 API 呼叫費用可能進一步降低，回應速度可能更快。長期來看 AI 服務將更便宜、更普及。

這對輝達股價有影響嗎？

消息公布後輝達股價反應有限。市場普遍認為輝達在訓練領域的優勢短期內不受威脅，但大客戶自研晶片的趨勢構成結構性壓力。

OpenAI Jalapeño 自研晶片：推論成本降五成

Q: 50% 的成本節省是真實數據嗎？

這是博通 CEO 陳福陽接受彭博社採訪時公布的早期實驗室測試數據，尚未經過第三方獨立驗證。完整技術報告數月後才會發布。

Q: Jalapeño 會向其他 AI 公司開放嗎？

官方表述為該晶片為全產業當前和未來 LLM 而建，暗示未來可能向外部公司開放，但目前首要任務是滿足 OpenAI 自身需求。

01

背景：OpenAI 為什麼要造自己的晶片？

OpenAI 是全球最大的 GPU 消耗方之一。每當使用者向 ChatGPT 提問，背後伺服器叢集就需要持續消耗大量算力完成「推論」（Inference）——即模型根據輸入產生回答的過程。隨著 GPT-4、GPT-5 系列模型能力持續升級，推論成本已成為 OpenAI 獲利路徑上最重的一塊石頭。

過去，OpenAI 幾乎完全依賴輝達 GPU 執行推論和訓練。輝達的 H100、H200、Blackwell 系列固然強大，但它們是通用加速器——為各種任務設計，而非專門為 LLM 推論最佳化。在 LLM 這個高度同質化的場景裡，大量算力開銷實際上是浪費。類比來說：輝達 GPU 是一把瑞士刀，而 Jalapeño 是一把專業手術刀。

競爭對手早已入局

公司	自研晶片	用途
Google	TPU (Tensor Processing Unit)	訓練 + 推論
Amazon	Trainium（訓練）/ Inferentia（推論）	訓練 + 推論
Microsoft	Maia 100	推論
Meta	MTIA	推論
OpenAI	Jalapeño（2026）	推論

OpenAI 是大廠中入局最晚的，但腳步走得很快——9 個月從設計到投片，聲稱是高效能先進半導體領域有史以來最快的 ASIC 開發週期。

02

Jalapeño 是什麼？技術詳解

2.1 它是一塊 ASIC，不是 GPU

ASIC（Application-Specific Integrated Circuit，專用積體電路）意味著：這塊晶片只做一件事——LLM 推論。它不玩遊戲，不跑訓練，不做通用運算。高度專一帶來的好處是：在它專攻的領域，效率極高。

「Jalapeño 從零開始，專為 LLM 推論設計，融入了我們對前沿模型在核心執行、記憶體搬運、網路通訊和服務模式方面的深刻洞察。」—— OpenAI 硬體負責人 Richard Ho

2.2 核心架構亮點

01
從零設計（Blank-slate Design）：不是在舊架構上修改打補丁，而是以現代 LLM 推論為出發點重新設計，每一個設計決策都圍繞 Transformer 架構的運算模式。
02
最小化資料搬運（Minimize Data Movement）：LLM 推論的瓶頸往往不在算力，而在記憶體頻寬。Jalapeño 的架構專門減少記憶體與運算單元之間的無效搬運。
03
運算 / 記憶體 / 網路均衡設計：針對 LLM 實際負載特徵做專項平衡，使實際利用率更接近理論峰值。
04
博通 Tomahawk 網路互連：使 Jalapeño 在大規模叢集部署時具備強大的節點間通訊能力，多卡協同推論超大模型至關重要。
05
Celestica 板卡 / 機架整合：電子製造服務商 Celestica 負責將晶片整合進伺服器主機板、機架系統，提供規模化量產能力。

2.3 製造製程與實驗室驗證

製造商：台積電（TSMC），3 奈米製程（與 Apple M4、輝達 Blackwell 同代）
實驗室運行模型：工程樣品已在 OpenAI 實驗室以目標頻率和功耗運行，包括 GPT-5.3-Codex-Spark——面向程式設計場景的旗艦推論模型之一

03

效能與成本：關鍵數據

⚠

注意：以下數據來自博通 CEO 陳福陽及 OpenAI 官方聲明，均為早期測試結果，完整技術報告將於數月後發布。需以「官方自測數字」看待，獨立第三方驗證尚未完成。

指標	Jalapeño（早期測試）	對比基準
推論成本節省	約 50%	相比當前主流 AI GPU
每瓦效能	顯著優於當前最先進水準	OpenAI 官方聲明
效能絕對值	與輝達 Blackwell、Google TPU 相當	博通 CEO 陳福陽（路透社）
熱耗散表現	優於預期	OpenAI 內部測試

博通 CEO 陳福陽（Hock Tan）在 Bloomberg 採訪中表示：「到目前為止，Jalapeño 相比典型 AI GPU 展現出約 50% 的成本節省。」OpenAI 總裁 Greg Brockman 補充：「Jalapeño 從初始設計到投片只用了 9 個月，部分設計和最佳化過程還使用了 OpenAI 自己的 AI 模型。」

「50%」的數字目前仍是 Broadcom 方面的早期實驗室數據，正式量產後的實際效果需等待：① OpenAI 發布完整技術報告；② 微軟等合作夥伴完成資料中心實際部署；③ 第三方獨立基準測試。

04

開發過程：9 個月，史上最快 ASIC 開發週期

Jalapeño 從初始設計到製造投片（Tape-out）僅用了 9 個月。OpenAI 和博通聲稱這是高效能先進半導體領域有史以來最快的 ASIC 開發週期。

01
軟硬體深度協同開發：OpenAI 模型團隊與晶片團隊深度協作，避免傳統 ASIC 開發中「硬體工程師猜測軟體需求」的大量返工。
02
AI 輔助晶片設計：OpenAI 自己的 AI 模型被用於加速晶片設計的部分決策和最佳化過程（VentureBeat 援引知情人士稱使用了前代 OpenAI 模型）。
03
博通的成熟 IP 庫：博通在晶片實作、網路互連等方面有大量可復用的 IP，顯著縮短了從邏輯設計到物理實作的週期。

05

產業鏈與合作夥伴

角色	公司	負責內容
晶片架構設計	OpenAI	LLM 推論最佳化方向、全端架構設計
晶片實作 & 網路	博通（Broadcom）	矽片實作、Tomahawk 網路晶片、量產支援
晶圓代工	台積電（TSMC）	3 奈米製程製造
系統整合	Celestica	主機板、機架、伺服器系統整合、量產
首批部署客戶	微軟 Azure	資料中心部署（年底開始）

06

部署計畫與商業路線圖

近期（2026 年底）

首批晶片樣品已在 OpenAI 實驗室測試
年底前正式部署至微軟及其他資料中心合作夥伴
優先服務 OpenAI 內部推論需求（ChatGPT、Codex、API）

中期（2027 年）

大規模量產，實際推論量顯著提升
博通 CEO 預測部署規模將超過此前預測的 1.3 吉瓦（GW）
可能向外部 AI 公司開放使用（官方描述該晶片「為全產業當前和未來 LLM 而建」）

長期（至 2029 年）

OpenAI 目標：用自研晶片支撐 10 吉瓦（10 GW） 算力（約 10 座核電廠的發電量級別）
多代晶片路線圖已規劃，博通將持續合作；下一代晶片預計 2028 年推出，此後每年迭代
未來可能擴展至訓練晶片（目前僅涵蓋推論）

07

競爭格局：輝達的護城河還在嗎？

Jalapeño 能「替代」輝達嗎？短期內：不能

01
只做推論，不做訓練：訓練前沿大模型仍高度依賴輝達 GPU。2026 年 2 月，輝達以 300 億美元直接投資 OpenAI，雙方戰略綁定極深。
02
CUDA 軟體生態：輝達用十餘年構建的 CUDA 開發者生態是最難跨越的護城河，Jalapeño 目前無法替代。
03
靈活性侷限：ASIC 高度專一，若未來 LLM 架構發生根本性改變，專用晶片的適配成本很高。

戰略意義：「分散供應，談判籌碼」

哪怕 Jalapeño 只承擔 OpenAI 20%~30% 的推論負載，也意味著真實節約大量成本、獲得與輝達談判採購價格的底氣、不再受單一供應商約束。這與 Google、Amazon、Microsoft 的策略如出一轍：不是「拋棄輝達」，而是「不再完全依賴輝達」。

「Nobody wants to be beholden to Nvidia.」—— Quilter Cheviot 全球科技研究主管 Ben Barringer

輝達與博通的應對

輝達優勢在於 Vera Rubin 平台、CUDA 生態，以及與 OpenAI 300 億美元的投資綁定——雙方既是競爭者，又是深度利益共同體。博通則正在成為「AI 客製晶片界的代工皇」——同時為 Google（TPU v5/v6）、Meta（MTIA）和 OpenAI（Jalapeño）設計客製 ASIC。2026 年前 5 個月，博通股價年漲幅約 18%；自 2022 年底以來累計漲幅接近 7 倍。

08

對 AI 產業的深遠影響

01
推論經濟學將重塑 AI 商業模式：若 50% 成本節省在生產環境驗證，ChatGPT API 呼叫成本可能進一步下降，OpenAI 獲利路徑更清晰，「AI 價格戰」底線將進一步拉低。
02
「全端 AI 公司」成為新標準：OpenAI 正在設計晶片架構、核心、記憶體系統、網路、排程、部署系統和產品體驗——競爭維度從「誰的模型更好」演變為「誰的全端效率更高」。
03
半導體格局加速分化：贏家包括博通、台積電、SK 海力士 / 三星（HBM 記憶體）；承壓方包括輝達（推論市場份額可能被逐步蠶食）、AMD。

09

關鍵人物

姓名	職位	角色
Greg Brockman	OpenAI 聯合創辦人 & 總裁	公開宣布發布，定性為「全端基礎設施戰略」
Richard Ho	OpenAI 硬體專案負責人	技術架構領導者
Hock Tan（陳福陽）	博通 CEO	公開聲稱效能媲美 Blackwell、成本節省 50%
Sam Altman	OpenAI CEO	整體戰略推動者（曾公開表示希望 OpenAI 掌控算力命脈）

10

時間軸梳理

timeline

2025 年 10 月  →  OpenAI 與博通正式宣布合作開發客製晶片
2026 年 2 月   →  輝達向 OpenAI 直接投資 300 億美元（含 Vera Rubin 算力協議）
2026 年 6 月 24 日 →  Jalapeño 晶片公開發表，工程樣品在實驗室運行
2026 年底     →  首批商用部署（微軟 Azure 及其他合作夥伴資料中心）
2027 年       →  大規模量產，部署規模超 1.3 GW
2028 年（預計）→  第二代晶片發布
2029 年（目標）→  自研晶片支撐 10 GW 算力規模

FAQ

常見問題

不是，至少現在不是。它只做 LLM 推論，不做訓練。輝達在訓練階段的地位短期內無法撼動，雙方更多是互補關係。

這是博通 CEO 陳福陽接受彭博社採訪時公布的早期實驗室測試數據，尚未經過第三方獨立驗證。完整技術報告數月後才會發布，需謹慎看待。

如果成本節省驗證成功，ChatGPT / API 呼叫費用可能進一步降低，回應速度可能更快。長期來看 AI 服務將更便宜、更普及。

官方未作說明。OpenAI 內部有以食物命名專案的傳統，「辣椒」可能暗示這款晶片的「辛辣」效能或對市場格局的刺激效果。

OpenAI 和博通的官方表述是該晶片「為全產業當前和未來 LLM 而建」，暗示未來可能向外部公司開放，但目前首要任務是滿足 OpenAI 自身需求。

博通和 OpenAI 已規劃多代路線圖，下一代晶片預計 2028 年推出，之後逐年迭代。

消息公布後輝達股價反應有限。市場普遍認為輝達在訓練領域的優勢短期內不受威脅，但長期來看大客戶自研晶片的趨勢構成結構性壓力。

結語

Jalapeño 不是終結輝達統治的銀彈，但它真實存在、已在實驗室運行 GPT-5.3-Codex-Spark，並標誌著「AI 公司單純向最高出價者購買算力」的時代正在結束。OpenAI 加入 Google、Amazon、Microsoft、Meta 的自研矽行列——目標不是完全替換輝達，而是獲得槓桿、降低成本、掌控全端。若 50% 成本數字在生產環境成立，AI 經濟學將發生有意義的變化。

對開發者而言，Jalapeño 的直接影響是 Codex / ChatGPT API 可能更便宜、更快——但你在 Mac 上寫程式、跑 Xcode、部署 OpenClaw Agent 的工作負載並不會因此消失。全端 AI 時代反而把「雲端推論降本」與「本機 / 遠端 Mac 開發環境」拆成兩條並行鏈路：前者由 Jalapeño 們最佳化，後者仍須 Apple Silicon + 圖形工作階段承接。若你主力機是 Windows/Linux、需要驗收 Codex Spark 或 OpenClaw 在 macOS 上的 GUI 邊界，VNCMac 遠端 Mac+VNC 仍是最短路徑——下方按鈕可立即開通 M4 節點。

OpenAI × 博通發表首款自研 AI 晶片 Jalapeño