已登ICRA 2026,VLA实用化路线彻底杀疯了!

📅 2026-06-27 17:24 163 政策 原文:163
网易首页 > 网易号 > 正文 申请入驻

已登ICRA 2026,VLA实用化路线彻底杀疯了!

0
分享至

原文作者:公众号“计算机顶会大全”

原文链接:https://mp.weixin.qq.com/s/SbiHonAq0qYEP-sC-sB-bA

近期顶会工作来看,VLA正在进入新阶段:不只是能做任务,而是要能稳定、低成本、跨场景地落地到真实机器人系统中。

这类研究共同释放了一个信号:具身智能的竞争点正在从大模型能力展示转向实用化能力验证。一方面,研究开始关注多机器人本体、导航与操作统一、仿真到真实迁移等真实部署问题;另一方面,评测标准也不再只看平均成功率,而是更重视空间扰动、物体变化、语言歧义和任务复杂度下的鲁棒性退化。同时,力觉、触觉等非视觉模态也开始被纳入VLA框架,用来解决接触丰富操作中的精细控制难题。本文整理了20篇 VLA实用化相关前沿论文。

论文介绍:

ICRA 2026| Rethinking the Practicality of Vision-language-action Model: A Comprehensive Benchmark and An Improved Baseline


现有VLA真的适合真实机器人部署吗?论文指出,当前很多VLA模型依赖大参数规模、大规模预训练和固定机械臂场景,存在训练成本高、跨本体适配弱、真实部署困难等问题。为此,作者提出面向实用化评测的CEBench基准,覆盖单臂操作、双臂操作和真实世界双臂移动操作,并引入背景变化、物体干扰、桌面高度变化等领域随机化设置,专门测试VLA在真实扰动下的稳定性。


方法上,论文提出轻量化基线LLaVA-VLA,基于小型视觉语言模型构建,通过多视角图像输入、本体状态标记、动作分块和两阶段训练,实现导航与操作统一建模。实验表明,小模型在CALVIN等任务上接近甚至超过部分大模型;多视角输入、本体状态标记和合适动作分块都能显著提升性能;在真实双臂和移动操作任务中,模型也展现出更强鲁棒性。

这篇工作的价值在于,它不再单纯追求更大的机器人模型,而是强调低成本训练、跨本体泛化、真实扰动评测和移动操作落地。对具身智能研究来说,这意味着VLA正在从模型炫技走向真实可用。

论文介绍:

ICRA 2026| FD-VLA: Force-Distilled Vision-Language-Action Model for Contact-Rich Manipulation


过去,VLA模型主要依赖视觉和语言来完成机器人操作,但在真实场景中,很多任务并不是看见就能做好。比如插头插入、按钮按压、擦白板等接触丰富任务,真正影响成功率的是接触力、阻力变化、摩擦和细微形变。

这篇论文关注的正是VLA的力觉短板。论文提出FD-VLA,通过力蒸馏机制,让模型在训练阶段利用真实力信号学习潜在力表示;在推理阶段,则不再依赖实体力传感器,而是根据视觉观察和机器人本体状态预测力标记,并与视觉语言信息共同生成动作。这样既保留了力觉对接触操作的帮助,又降低了真实部署时对昂贵、脆弱传感器的依赖。


创新点主要在于三方面:一是把力觉信息以蒸馏方式融入VLA,而不是简单拼接原始力信号;二是利用视觉和本体状态预测接触相关力表示,提升任务相关性和鲁棒性;三是在真实机器人平台上验证擦白板、按按钮、插头插入等典型接触任务。实验表明,FD-VLA整体成功率明显高于无力觉版本和直接输入原始力信号的方法,说明可学习的力表示比粗暴使用传感器数据更有效。

这篇论文的价值在于,它把VLA从看懂再行动推进到理解接触再行动。对具身智能研究来说,力觉蒸馏、触觉增强、状态建模和接触丰富操作,正在成为VLA实用化落地的重要发文切口。


论文介绍:

LIBERO-X: Robustness Litmus for Vision-Language-Action Models


过去,很多VLA模型在标准机器人基准上表现不错,但这并不等于它们真的具备真实部署能力。真实环境中的机器人任务,往往会同时遇到物体位置变化、场景结构变化、未见物体、视觉干扰和语言指令改写等问题。

这篇论文提出LIBERO-X,核心不是再造一个更强模型,而是构建一个更严格的VLA鲁棒性评测基准,用来检验现有视觉语言动作模型到底稳不稳。方法上,LIBERO-X设计了五级递进式测试协议,从局部空间扰动、大范围空间扰动,到场景拓扑重构、视觉属性变化和语义等价指令改写,逐层增加真实部署难度。同时,它构建了更高多样性的训练数据,并通过多标签诊断分析模型在交互类型、子任务数量、空间关系、物体属性等维度上的失败模式。


实验结果显示,多个代表性VLA模型在LIBERO-X上都会随难度增加明显掉点,尤其在拓扑变化、未见物体、语言改写和多步长程任务中表现不稳定。这说明现有VLA并不是不会完成任务,而是缺少对复杂分布偏移的稳定泛化能力。

这篇工作的价值在于,它把VLA评测从平均成功率推进到鲁棒性诊断。对具身智能研究来说,未来不仅要做更大的模型,也要做更真实的基准、更细的失败分析和更强的空间泛化、语言接地与长程执行能力,这正是VLA实用化落地的重要发文切口。

雷峰网

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
女性偷腥后当晚与丈夫同房是什么感觉?一位39岁的女人说出实情

女性偷腥后当晚与丈夫同房是什么感觉?一位39岁的女人说出实情

混音情感
2026-06-27 16:30:17
大学专业死亡潮来临,正准备报志愿的高考生傻眼了

大学专业死亡潮来临,正准备报志愿的高考生傻眼了

果壳
2026-06-26 16:19:44
“为冲动买单!”广东考生数学140,总分691无缘清北,后悔也晚了

“为冲动买单!”广东考生数学140,总分691无缘清北,后悔也晚了

林林先生
2026-06-26 21:04:27
白玉兰奖红毯生图来了!杨幂脸上凸起一条线,杨紫用力过猛妆太浓

白玉兰奖红毯生图来了!杨幂脸上凸起一条线,杨紫用力过猛妆太浓

萌神木木
2026-06-26 19:59:56
三战三平,佛得角小组第二晋级,下一场挑战卫冕冠军阿根廷

三战三平,佛得角小组第二晋级,下一场挑战卫冕冠军阿根廷

澎湃新闻
2026-06-27 10:12:27
惊天逆转!伊朗最高领袖密信曝光:谈判代表根本没按指令行事!

惊天逆转!伊朗最高领袖密信曝光:谈判代表根本没按指令行事!

近史谈
2026-06-27 13:07:17
央视刘芳菲:两任爱人一死缓一惨死,原来这才是她最正确的决定

央视刘芳菲:两任爱人一死缓一惨死,原来这才是她最正确的决定

飘飘然的娱乐汇
2026-06-26 19:40:06
澳门特大卖淫窝点被端,官媒公开详情,幕后操盘者身份大有来头

澳门特大卖淫窝点被端,官媒公开详情,幕后操盘者身份大有来头

橘仔看世界
2026-06-26 08:57:17
四提白玉兰终封后,杨紫发文:仍觉不真实

四提白玉兰终封后,杨紫发文:仍觉不真实

小椰的奶奶
2026-06-27 13:41:47
随着塞内加尔5-0大胜,韩国出线概率从末轮战后94%逐步滑落至50%

随着塞内加尔5-0大胜,韩国出线概率从末轮战后94%逐步滑落至50%

凌空倒钩
2026-06-27 06:04:48
赔 529 万!湖北男子猎杀10710只,冷库中搜出2100多只

赔 529 万!湖北男子猎杀10710只,冷库中搜出2100多只

万象硬核本尊
2026-06-26 22:04:13
多名院士研究发现:吃一瓣大蒜,就等于给血管添一次堵,真的假的

多名院士研究发现:吃一瓣大蒜,就等于给血管添一次堵,真的假的

汪医生健康百科
2026-06-25 20:25:06
002485,实控人无期徒刑!公司紧急提示风险

002485,实控人无期徒刑!公司紧急提示风险

证券时报e公司
2026-06-27 15:44:17
向佐自嘲:我是三个二代,富二代、星二代。易立竞问他:还有一个呢?他说:不能说,然后指了指黑色皮鞋

向佐自嘲:我是三个二代,富二代、星二代。易立竞问他:还有一个呢?他说:不能说,然后指了指黑色皮鞋

美芽
2026-06-27 12:49:41
不是李春江!也不是郭士强!广东新主帅人选曝光,保底总决赛了!

不是李春江!也不是郭士强!广东新主帅人选曝光,保底总决赛了!

绯雨儿
2026-06-27 10:58:19
世界杯出线形势:32强已定28席!12队出局 淘汰赛首轮9组对决出炉

世界杯出线形势:32强已定28席!12队出局 淘汰赛首轮9组对决出炉

我爱英超
2026-06-27 13:21:31
儿子出国后16年没联系,我癌症住院时,主治医生摘下口罩:妈

儿子出国后16年没联系,我癌症住院时,主治医生摘下口罩:妈

五元讲堂
2025-06-12 15:16:01
挪威主帅:有球迷花光所有预算来看哈兰德?我不接受道德绑架

挪威主帅:有球迷花光所有预算来看哈兰德?我不接受道德绑架

懂球帝
2026-06-27 07:37:06
3轮2分!世界杯双冠王小组出局,主帅队长内讧,阿根廷成最大赢家

3轮2分!世界杯双冠王小组出局,主帅队长内讧,阿根廷成最大赢家

球场没跑道
2026-06-27 11:34:27
张钧甯回应原名上热搜 为原名难认向大家道歉

张钧甯回应原名上热搜 为原名难认向大家道歉

东方不败然多多
2026-06-26 16:47:17
2026-06-27 17:23:00
雷峰网 incentive-icons
雷峰网
关注智能与未来!
69884文章数 656150关注度
往期回顾 全部

科技要闻

GPT-5.6发布,你暂时用不了!Mythos也放行

头条要闻

佛得角队历史性闯入世界杯32强 主帅回应

头条要闻

佛得角队历史性闯入世界杯32强 主帅回应

体育要闻

韩国球迷感谢西班牙:他们本可做掉我们

娱乐要闻

四提白玉兰终封后,杨紫:仍觉不真实

财经要闻

OpenAI推迟IPO重创软银!

汽车要闻

首搭华为乾崑智驾ADS5 启境GT7上市售价20.99万-32.99万元

态度原创

旅游
游戏
亲子
艺术
教育

旅游要闻

云南一小县城,名字藏着三国千古秘事,当地老台见证两族千年约定

D加密再遭破解!足球大作世界杯大更新一键free了

亲子要闻

果然还是哥哥比较厉害

艺术要闻

16幅 国外著名艺术家的画作

教育要闻

高一学霸一个月备战高考,斩获620分,已提前入围中科大少年班,独家揭秘备战过程

相关动态

推动人形机器人与具身智能在真实环境常态化部署应用,两 ... 2026-06-30 thepaper 36氪研究院 | 2026年具身智能产业发展研究报告 2026-06-30 36kr MolmoAct:可在空间中进行推理的动作推理模型 - 知乎 2026-06-30 zhuanlan MolmoSpaces:用于机器人导航与操控的大规模开放生态系统 2026-06-30 huggingface 「一页纸」吃透产业链之:人形机器人,Figure链与特斯拉 ... 2026-06-30 36kr 工业和信息化部办公厅 国务院国资委办公厅关于联合开展 ... 2026-06-30 miit