2026年機器人VLA模型廠商更新動態舉要
摘要
VLA(Vision-Language-Action,視覺-語言-動作)模型為奠定人型機器人的基礎架構,但面臨生態碎片化與數據稀缺挑戰。在模型架構方面,開源與硬體抽象層將可推動跨平台部署,而觸覺感測與多模態時序對齊為多模態融合之關鍵;在數據方面,機器人即服務(RaaS)租賃模式將成為加速規模化與多樣數據收集的重要商業模式,而世界模型提供低成本數據補充,共同解決物理互動數據稀缺困境。
VLA(Vision-Language-Action,視覺-語言-動作)模型為奠定人型機器人的基礎架構,但面臨生態碎片化與數據稀缺挑戰。在模型架構方面,開源與硬體抽象層將可推動跨平台部署,而觸覺感測與多模態時序對齊為多模態融合之關鍵;在數據方面,機器人即服務(RaaS)租賃模式將成為加速規模化與多樣數據收集的重要商業模式,而世界模型提供低成本數據補充,共同解決物理互動數據稀缺困境。
© 2026 拓墣科技 及/或 集邦科技 版權所有