VLA自動駕駛模型邁入市場化分析
摘要
VLA(Vision-Language-Action)是一種整合視覺、語言與行動的多模態AI架構;VLA模型一開始是在機器人領域受到廣泛討論,但由於該架構的泛化性與平台可遷移性高,自動駕駛領域也有許多廠商投入開發。2025下半年VLA模型已被用於量產車上,證明其在自動駕駛領域的價值。本篇報告主要探討VLA模型用於自動駕駛的優勢、遭遇到的挑戰,以及討論主要開發商與車廠的動態。
一. VLA模型提升可解釋性,但須大運算力支援
二. VLA模型的供應商以中國廠商最快實現裝車
三. 理想與小鵬自主開發VLA模型
四. 拓墣觀點
圖一 理想汽車AI推理可視化
圖二 Waymo EMM模型示意圖
圖三 Wayve LINGO-2
圖四 元戎啟行VLA模型域控制器產品展出
圖五 理想汽車的端到端架構演變
圖六 小鵬雲端與車端模型架構
表一 不同自動駕駛模型的比較
