推論成本直降 50% · 台積電 3 奈米 · 9 個月投片 · 競爭格局 · 部署路線圖
2026 年 6 月 24 日,OpenAI 與博通(Broadcom)聯合發表名為 Jalapeño 的首款客製 AI 推論晶片。這款專為大型語言模型(LLM)推論場景打造的 ASIC,聲稱相比主流 AI GPU 可節省約 50% 推論成本,每瓦效能指標大幅優於當前最先進水準,由台積電 3 奈米製程製造,年底將首先部署至微軟等合作夥伴的資料中心。本文完整涵蓋自研背景、技術架構、效能數據、9 個月開發週期、產業鏈分工、部署路線圖、輝達競爭格局、產業影響、關鍵人物、時間軸與 FAQ 全部要點;並說明開發者如何在 VNCMac 遠端 Mac 上驗收 Codex / OpenClaw 等 Agent 工作流。
OpenAI 是全球最大的 GPU 消耗方之一。每當使用者向 ChatGPT 提問,背後伺服器叢集就需要持續消耗大量算力完成「推論」(Inference)——即模型根據輸入產生回答的過程。隨著 GPT-4、GPT-5 系列模型能力持續升級,推論成本已成為 OpenAI 獲利路徑上最重的一塊石頭。
過去,OpenAI 幾乎完全依賴輝達 GPU 執行推論和訓練。輝達的 H100、H200、Blackwell 系列固然強大,但它們是通用加速器——為各種任務設計,而非專門為 LLM 推論最佳化。在 LLM 這個高度同質化的場景裡,大量算力開銷實際上是浪費。類比來說:輝達 GPU 是一把瑞士刀,而 Jalapeño 是一把專業手術刀。
| 公司 | 自研晶片 | 用途 |
|---|---|---|
| TPU (Tensor Processing Unit) | 訓練 + 推論 | |
| Amazon | Trainium(訓練)/ Inferentia(推論) | 訓練 + 推論 |
| Microsoft | Maia 100 | 推論 |
| Meta | MTIA | 推論 |
| OpenAI | Jalapeño(2026) | 推論 |
OpenAI 是大廠中入局最晚的,但腳步走得很快——9 個月從設計到投片,聲稱是高效能先進半導體領域有史以來最快的 ASIC 開發週期。
ASIC(Application-Specific Integrated Circuit,專用積體電路)意味著:這塊晶片只做一件事——LLM 推論。它不玩遊戲,不跑訓練,不做通用運算。高度專一帶來的好處是:在它專攻的領域,效率極高。
「Jalapeño 從零開始,專為 LLM 推論設計,融入了我們對前沿模型在核心執行、記憶體搬運、網路通訊和服務模式方面的深刻洞察。」—— OpenAI 硬體負責人 Richard Ho
從零設計(Blank-slate Design):不是在舊架構上修改打補丁,而是以現代 LLM 推論為出發點重新設計,每一個設計決策都圍繞 Transformer 架構的運算模式。
最小化資料搬運(Minimize Data Movement):LLM 推論的瓶頸往往不在算力,而在記憶體頻寬。Jalapeño 的架構專門減少記憶體與運算單元之間的無效搬運。
運算 / 記憶體 / 網路均衡設計:針對 LLM 實際負載特徵做專項平衡,使實際利用率更接近理論峰值。
博通 Tomahawk 網路互連:使 Jalapeño 在大規模叢集部署時具備強大的節點間通訊能力,多卡協同推論超大模型至關重要。
Celestica 板卡 / 機架整合:電子製造服務商 Celestica 負責將晶片整合進伺服器主機板、機架系統,提供規模化量產能力。
注意:以下數據來自博通 CEO 陳福陽及 OpenAI 官方聲明,均為早期測試結果,完整技術報告將於數月後發布。需以「官方自測數字」看待,獨立第三方驗證尚未完成。
| 指標 | Jalapeño(早期測試) | 對比基準 |
|---|---|---|
| 推論成本節省 | 約 50% | 相比當前主流 AI GPU |
| 每瓦效能 | 顯著優於當前最先進水準 | OpenAI 官方聲明 |
| 效能絕對值 | 與輝達 Blackwell、Google TPU 相當 | 博通 CEO 陳福陽(路透社) |
| 熱耗散表現 | 優於預期 | OpenAI 內部測試 |
博通 CEO 陳福陽(Hock Tan)在 Bloomberg 採訪中表示:「到目前為止,Jalapeño 相比典型 AI GPU 展現出約 50% 的成本節省。」OpenAI 總裁 Greg Brockman 補充:「Jalapeño 從初始設計到投片只用了 9 個月,部分設計和最佳化過程還使用了 OpenAI 自己的 AI 模型。」
「50%」的數字目前仍是 Broadcom 方面的早期實驗室數據,正式量產後的實際效果需等待:① OpenAI 發布完整技術報告;② 微軟等合作夥伴完成資料中心實際部署;③ 第三方獨立基準測試。
Jalapeño 從初始設計到製造投片(Tape-out)僅用了 9 個月。OpenAI 和博通聲稱這是高效能先進半導體領域有史以來最快的 ASIC 開發週期。
軟硬體深度協同開發:OpenAI 模型團隊與晶片團隊深度協作,避免傳統 ASIC 開發中「硬體工程師猜測軟體需求」的大量返工。
AI 輔助晶片設計:OpenAI 自己的 AI 模型被用於加速晶片設計的部分決策和最佳化過程(VentureBeat 援引知情人士稱使用了前代 OpenAI 模型)。
博通的成熟 IP 庫:博通在晶片實作、網路互連等方面有大量可復用的 IP,顯著縮短了從邏輯設計到物理實作的週期。
| 角色 | 公司 | 負責內容 |
|---|---|---|
| 晶片架構設計 | OpenAI | LLM 推論最佳化方向、全端架構設計 |
| 晶片實作 & 網路 | 博通(Broadcom) | 矽片實作、Tomahawk 網路晶片、量產支援 |
| 晶圓代工 | 台積電(TSMC) | 3 奈米製程製造 |
| 系統整合 | Celestica | 主機板、機架、伺服器系統整合、量產 |
| 首批部署客戶 | 微軟 Azure | 資料中心部署(年底開始) |
只做推論,不做訓練:訓練前沿大模型仍高度依賴輝達 GPU。2026 年 2 月,輝達以 300 億美元直接投資 OpenAI,雙方戰略綁定極深。
CUDA 軟體生態:輝達用十餘年構建的 CUDA 開發者生態是最難跨越的護城河,Jalapeño 目前無法替代。
靈活性侷限:ASIC 高度專一,若未來 LLM 架構發生根本性改變,專用晶片的適配成本很高。
哪怕 Jalapeño 只承擔 OpenAI 20%~30% 的推論負載,也意味著真實節約大量成本、獲得與輝達談判採購價格的底氣、不再受單一供應商約束。這與 Google、Amazon、Microsoft 的策略如出一轍:不是「拋棄輝達」,而是「不再完全依賴輝達」。
「Nobody wants to be beholden to Nvidia.」—— Quilter Cheviot 全球科技研究主管 Ben Barringer
輝達優勢在於 Vera Rubin 平台、CUDA 生態,以及與 OpenAI 300 億美元的投資綁定——雙方既是競爭者,又是深度利益共同體。博通則正在成為「AI 客製晶片界的代工皇」——同時為 Google(TPU v5/v6)、Meta(MTIA)和 OpenAI(Jalapeño)設計客製 ASIC。2026 年前 5 個月,博通股價年漲幅約 18%;自 2022 年底以來累計漲幅接近 7 倍。
推論經濟學將重塑 AI 商業模式:若 50% 成本節省在生產環境驗證,ChatGPT API 呼叫成本可能進一步下降,OpenAI 獲利路徑更清晰,「AI 價格戰」底線將進一步拉低。
「全端 AI 公司」成為新標準:OpenAI 正在設計晶片架構、核心、記憶體系統、網路、排程、部署系統和產品體驗——競爭維度從「誰的模型更好」演變為「誰的全端效率更高」。
半導體格局加速分化:贏家包括博通、台積電、SK 海力士 / 三星(HBM 記憶體);承壓方包括輝達(推論市場份額可能被逐步蠶食)、AMD。
| 姓名 | 職位 | 角色 |
|---|---|---|
| Greg Brockman | OpenAI 聯合創辦人 & 總裁 | 公開宣布發布,定性為「全端基礎設施戰略」 |
| Richard Ho | OpenAI 硬體專案負責人 | 技術架構領導者 |
| Hock Tan(陳福陽) | 博通 CEO | 公開聲稱效能媲美 Blackwell、成本節省 50% |
| Sam Altman | OpenAI CEO | 整體戰略推動者(曾公開表示希望 OpenAI 掌控算力命脈) |
2025 年 10 月 → OpenAI 與博通正式宣布合作開發客製晶片 2026 年 2 月 → 輝達向 OpenAI 直接投資 300 億美元(含 Vera Rubin 算力協議) 2026 年 6 月 24 日 → Jalapeño 晶片公開發表,工程樣品在實驗室運行 2026 年底 → 首批商用部署(微軟 Azure 及其他合作夥伴資料中心) 2027 年 → 大規模量產,部署規模超 1.3 GW 2028 年(預計)→ 第二代晶片發布 2029 年(目標)→ 自研晶片支撐 10 GW 算力規模
不是,至少現在不是。它只做 LLM 推論,不做訓練。輝達在訓練階段的地位短期內無法撼動,雙方更多是互補關係。
這是博通 CEO 陳福陽接受彭博社採訪時公布的早期實驗室測試數據,尚未經過第三方獨立驗證。完整技術報告數月後才會發布,需謹慎看待。
如果成本節省驗證成功,ChatGPT / API 呼叫費用可能進一步降低,回應速度可能更快。長期來看 AI 服務將更便宜、更普及。
官方未作說明。OpenAI 內部有以食物命名專案的傳統,「辣椒」可能暗示這款晶片的「辛辣」效能或對市場格局的刺激效果。
OpenAI 和博通的官方表述是該晶片「為全產業當前和未來 LLM 而建」,暗示未來可能向外部公司開放,但目前首要任務是滿足 OpenAI 自身需求。
博通和 OpenAI 已規劃多代路線圖,下一代晶片預計 2028 年推出,之後逐年迭代。
消息公布後輝達股價反應有限。市場普遍認為輝達在訓練領域的優勢短期內不受威脅,但長期來看大客戶自研晶片的趨勢構成結構性壓力。
Jalapeño 不是終結輝達統治的銀彈,但它真實存在、已在實驗室運行 GPT-5.3-Codex-Spark,並標誌著「AI 公司單純向最高出價者購買算力」的時代正在結束。OpenAI 加入 Google、Amazon、Microsoft、Meta 的自研矽行列——目標不是完全替換輝達,而是獲得槓桿、降低成本、掌控全端。若 50% 成本數字在生產環境成立,AI 經濟學將發生有意義的變化。
對開發者而言,Jalapeño 的直接影響是 Codex / ChatGPT API 可能更便宜、更快——但你在 Mac 上寫程式、跑 Xcode、部署 OpenClaw Agent 的工作負載並不會因此消失。全端 AI 時代反而把「雲端推論降本」與「本機 / 遠端 Mac 開發環境」拆成兩條並行鏈路:前者由 Jalapeño 們最佳化,後者仍須 Apple Silicon + 圖形工作階段承接。若你主力機是 Windows/Linux、需要驗收 Codex Spark 或 OpenClaw 在 macOS 上的 GUI 邊界,VNCMac 遠端 Mac+VNC 仍是最短路徑——下方按鈕可立即開通 M4 節點。