AI推理時代來臨:從GPU到ASIC的晶片技術與生態競逐
摘要
2025年隨著AI Inference需求大幅擴展,各大GPU供應商接連推出針對Inference Prefill階段設計的AI晶片,例如NVIDIA Rubin CPX、Intel Crescent Island、Qualcomm AI200;此外,中國華為也推出Prefill專用ASIC Ascend 950PR。然而,即使Google、AWS、Meta、Microsoft等四大CSP皆已推出Inference應用的ASIC,仍未推出針對Prefill階段的ASIC。
因此本篇報告主要深度解析:(1)目前ASIC開發進度;(2) ASIC與GPU能效比較;(3) Inference對AI晶片的規格要求;(4)目前Inference Prefill晶片發展;(5) Inference應用的ASIC技術規格展望。期能為廠商與投資人解析在Inference應用擴增背景下ASIC的市場發展方向。
一. 目前ASIC開發進度
二. ASIC與GPU能效比較
三. Inference對AI晶片規格要求
四. 目前Inference Prefill晶片發展
五. Inference應用的ASIC技術規格展望
六. 拓墣觀點
圖一 AI晶片能效比趨勢
圖二 Scaling Law三階段
圖三 SPAD架構示意圖
圖四 NVIDIA Rubin CPX結構
圖五 VR NVL144 CPX Compute Tray
圖六 華為Ascend 950PR
圖七 Intel Crescent Island
圖八 Qualcomm AI200
表一 2024~2027年AI晶片Roadmap
表二 2026~2028年ASIC設計服務商預計取得專案
表三 主要AI晶片算力與能效比
表四 Prefill與Decode比較
表五 目前已公布Inference AI晶片列表
表六 AI晶片規格演進
