为什么机器人需要一个"小脑"?
大模型虽强——但太慢了。GPT-4级别的推理需要秒级延迟,而机器人在行走时需要毫秒级的反应来维持平衡。这就是为什么具身智能需要"大脑+小脑"双层架构:
- 大脑(Cerebrum):VLA大模型,负责慢速高层推理——任务理解、目标规划、场景理解,运行频率1-10Hz
- 小脑(Cerebellum):高速运动控制器,负责快速反射——平衡维持、力控调节、碰撞避让,运行频率100-1000Hz
技术实现方案
| 层级 | 功能 | 频率 | 典型技术 | 延迟要求 |
|---|---|---|---|---|
| 大脑 | 任务分解、场景语义理解、长期规划 | 1-10 Hz | VLA大模型(RT-2/π0.5/GR00T) | 100-1000ms |
| 小脑 | 运动规划、平衡控制、力调节 | 100-500 Hz | MPC(模型预测控制)、RL策略 | 2-10ms |
| 脊髓 | 关节电流/力矩闭环、安全急停 | 1000-10000 Hz | 嵌入式PID、FOC电机控制 | <100μs |
大脑和小脑如何通信?
大脑输出的不是每个关节的角度,而是子目标——例如"在3秒内将右手移动到坐标(x,y,z),夹爪张开30mm"。小脑接收子目标后,独立完成轨迹生成和实时执行。如果过程中遇到意外阻碍,小脑可以临时调整或暂停,并向大脑请求重新规划。
行业标准:200ms闭环
YD/T 6770-2026《具身智能基准测试方法》行业标准明确要求:大脑与小脑协同响应时间≤200ms。超过这个阈值,机器人在动态环境中就会出现明显的"反应迟钝"——这是区分玩具和实用机器人的关键指标之一。
参考:工信部YD/T 6770-2026、Boston Dynamics控制架构、IEEE ICRA 2026