不同自動駕駛模型的比較
摘要
VLA(Vision-Language-Action)是一種整合視覺、語言與行動的多模態AI架構;VLA模型一開始是在機器人領域受到廣泛討論,但由於該架構的泛化性與平台可遷移性高,自動駕駛領域也有許多廠商投入開發。2025下半年VLA模型已被用於量產車上,證明其在自動駕駛領域的價值。本篇報告主要探討VLA模型用於自動駕駛的優勢、遭遇到的挑戰,以及討論主要開發商與車廠的動態。
VLA(Vision-Language-Action)是一種整合視覺、語言與行動的多模態AI架構;VLA模型一開始是在機器人領域受到廣泛討論,但由於該架構的泛化性與平台可遷移性高,自動駕駛領域也有許多廠商投入開發。2025下半年VLA模型已被用於量產車上,證明其在自動駕駛領域的價值。本篇報告主要探討VLA模型用於自動駕駛的優勢、遭遇到的挑戰,以及討論主要開發商與車廠的動態。
© 2025 拓墣科技 及/或 集邦科技 版權所有