机器人架构的路线之争
2026年2月,Figure AI宣布与OpenAI终止合作,转向完全自研端到端神经网络——这一事件引爆了机器人控制架构的路线之争。端到端(End-to-End)和模块化(Modular)两种架构各有拥趸,行业正处于关键的分岔路口。
模块化架构:经典三层范式
将机器人控制系统分为感知→规划→控制的串联管线:
- 感知层:SLAM、目标检测、位姿估计
- 规划层:任务规划(TAMP)、运动规划(RRT*/TrajOpt)
- 控制层:PID/MPC/阻抗控制执行
优势:可解释性强(每层输出可检查)、安全可验证、模块可独立升级
劣势:信息瓶颈(层间传递丢失细节)、误差累积、无法处理未建模场景
端到端架构:一个神经网络搞定一切
传感器输入→神经网络→动作输出,中间无显式模块划分:
优势:性能上限高(无信息瓶颈)、泛化潜力大、简化系统工程
劣势:黑箱不可解释、安全难保证、需要海量训练数据
为什么Figure选择了端到端?
Figure CEO Brett Adcock表示:"模块化架构的上限不够高——你永远无法用人工编写的感知→规划→控制管线达到人类的灵巧水平。" Figure在2026年展示了自研端到端网络在30天内取得的突破,包括从抽屉中取物品等此前未能完成的任务。关键进展:Figure 3系统实现了感知-决策-执行0.3秒闭环,搭载NVIDIA Jetson Thor(2070 TFLOPS)。
产业界的务实选择
尽管端到端路线引人注目,大多数工业机器人企业采取务实态度:
- 工业场景:仍以模块化为主,因为需要确定性、可追溯、安全认证
- 前沿探索:端到端用于非结构化操作研究,模块化作为兜底安全层
- 混合架构:用端到端VLA做高层任务理解,模块化做底层安全执行——这是当前主流共识
参考:Figure AI技术博客、ICRA 2026 Panel讨论、MIT/Stanford机器人架构综述