为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成 。论文标题:Multi-Modal Manipulation via...

为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

这项工作由伊利诺伊大学香槟分校 (UIUC) 、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成 。

为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

  • 论文标题:Multi-Modal Manipulation via Policy Consensus
  • 论文链接:https://arxiv.org/pdf/2509.23468
  • 主页链接:https://policyconsensus.github.io/

为什么特征拼接 (Feature Concatenation)会在机器人感知和决策中失效?

想象一下,你在黑漆漆的背包里找钥匙 。你的眼睛此时毫无用处,全靠指尖的触觉 ,这对你来说轻而易举 ,但在机器人领域,这却是一个非常困难的问题。

残酷的真相: 目前的机器人学习主流的多传感器融合的算法(Feature Concatenation)在处理这种任务时彻底失败了。我们的实验数据显示,当你给机器人加上触觉数据试图让它更聪明时 ,它的抓取成功率竟然从 35% 暴跌至 5%!为什么? 因为传统的方法把偶尔出现的关键触觉信号当作了 “噪音” 直接过滤掉了 。

当前方法的局限性

目前的多模态机器人学习方法通常使用特征拼接 (Feature Concatenation):提取所有传感器的嵌入 (embeddings),将其拼接成一个大向量,然后输入到一个单一的神经网络策略中 。

为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

这种方法看似合理,但存在两个根本缺陷:

问题 1:稀疏模态被视为噪声

  • 例如,一个机器人从不透明袋子中取记号笔的任务。90% 的过程中依靠视觉接近 ,但一旦进入袋子,视觉变得无用,触觉变得至关重要 。
  • 特征拼接会将统计上罕见的信号(触觉)视为噪声 。在训练中 ,网络会降低触觉信息的权重,专注于总是活跃的视觉特征 。
  • 我们的实验结果:在遮挡抓取任务中,RGB + 触觉的拼接基线仅达到 5% 的成功率 ,而仅使用 RGB 却有 35%。增加触觉信息反而因其被视为干扰噪声而降低了性能!

问题 2:无法灵活添加或移除模态

  • 特征拼接缺乏模块化 。如果想添加新传感器或移除故障传感器 ,必须从头开始重新训练整个策略,因为所有模态在特征层面紧密耦合 。
  • 这导致了昂贵的重训练成本,且系统在单个传感器故障时会发生灾难性故障 。

我们的解决方案:组合策略 (Compositional Policies)

我们的解决方案是重新思考模态的结合方式 。我们不将所有传感器强制输入单一网络 ,而是为每个模态训练单独的专家策略,并学习如何在策略层面组合它们的动作预测 。

工作原理

  • 模态特定专家 (Modality-Specific Experts):为每个感官模态(RGB、触觉 、点云等)训练作为扩散策略实例化的基于能量的策略表示 。每个专家专注于自己的感官流,互不干扰  。即使是 “稀疏 ” 模态(如触觉)也有自己的专用网络 ,使其能高度专注于接触动力学 。
  • 模态内分解 (Intra-Modality Factorization):在模态内部进一步分解为互补的子策略。例如,视觉可分为粗略几何推理和细粒度细节;触觉可分为初始接触检测和持续力控制  。
  • 学习共识权重 (Learn Consensus Weights):一个路由器网络 (Router) 学习预测共识权重,决定每个模态对最终动作的影响程度 。
为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

组合式策略框架概述

为什么这能解决问题

解决稀疏性:每个专家学习自己的动作分布,互不干扰。触觉专家不再与视觉竞争表示模型的表征能力,从而在富含接触的操作中变得高度专业化。

模块化设计:专家是独立训练的 。添加新传感器只需训练一个新的专家 ,并使用固定权重或快速微调将其与现有专家组合,无需重训练整个系统 。

简单的实现(implementation)方式:组合多个策略对应于概率分布相乘,在扩散模型(基于分数的能量模型)中 ,这等同于简单的分数函数相加 (summing score functions) 。

增量学习:即插即用的传感器

为了展示模块化 ,我们完全独立地训练了 RGB 和触觉策略,然后使用固定的相等权重将它们组合,没有进行任何联合训练 。

  • 尽管从未一起训练 ,组合后的策略成功完成了单独策略都无法处理的遮挡记号笔抓取任务 。这对于现实世界的部署(传感器逐步添加或更换)具有深远的意义 。
为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

鲁棒性与自适应性

运行时扰动:在执行过程中突然抢走物体,机器人能适应并完成任务 。

为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

传感器损坏:遮挡一个摄像头模拟故障,路由器简单地将权重转移到剩余的功能传感器上,表现保持稳定。

为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

物体重新定位:移动任务相关物体,策略能成功泛化。

为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?

为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

统计结果对比

我们使用了配备双 RealSense 摄像头和 FlexiTac 触觉传感器的 UR5e 机器人进行验证  。

RLBench 模拟任务:在四个操作任务上,我们的方法平均成功率为 66%,显著优于单模态策略 (49%) 和特征拼接 (56%) 。

真实世界:

  • 遮挡记号笔抓取(occluded marker picking):我们的方法成功率为 65% ,而 RGB-only 为 35% ,拼接方法仅为 5%(拼接方法反而没法很好的利用触觉确定物体是否被抓住)。
  • 勺子重定向 (Spoon Reorientation):一种灵巧的手内操作任务 。我们的方法成功率为 75%,拼接方法仅为 21% 。
  • 拼图插入 (Puzzle Insertion):需要毫米级精度。我们的方法任务成功率为 52%,拼接方法为 40% 。
为什么给机器人装上昂贵的触觉传感器	,反而让它变笨了?

总结

通过从特征级拼接转向策略级组合,我们为模态稀疏性问题提供了一个系统性的解决方案,同时实现了增量学习和鲁棒部署 。我们的 core insights 很简单:让每个模态拥有自己的 “专家” 并学习各自的相对影响力 ,而不是将所有传感器强制输入单一网络。

本文来自作者[春翌岍]投稿,不代表视听号立场,如若转载,请注明出处:https://stddy.com/zheh/202512-61708.html

(47)

文章推荐

  • 不讲武德?伊以宣布停火之后,伊朗向以色列打去大量导弹

    根据中新社6月24日报道,美国总统特朗普在社交媒体上发布伊以停火的消息,伊朗外长阿拉格齐却表示尚未达成任何停火协议,伊朗将继续对以色列进行惩罚性打击,打击时间将持续到24日凌晨4点之前。停火伊以双方停火的消息还未公布,以色列就挨了伊朗的一顿导弹打击。以色列军方证实,伊朗利用停火前的时间差向以色列发射

    2025年06月24日
    178
  • 全国疫情中高风险地区.全国疫情中高风险名单公布?

    中高风险地区怎么查询〖壹〗、微信查看疫情中高风险地区的方法如下:打开微信搜索:打开手机中的微信app,点击搜索选项。进入粤省事小程序:在搜索框中输入粤省事,并点击搜索结果中的小程序。选取疫情区域选项:在粤省事小程序页面中,找到并点击疫情区域的选项。查看高风险和中风险地区:进入疫情区域页面后,即可查

    2025年06月29日
    148
  • 实测辅助“微乐捉鸡麻将辅牌器(助赢神器通用版)

    这软件超厉害!东游麻将辅牌器购买(提高胜率软件)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”东游麻将辅牌器购买是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以加

    2025年09月06日
    100
  • 惹怒中国后,高市早苗又放话:要收回韩国领土,韩民称中国骂轻了

    日本政客高市早苗近期的一系列言论正在搅动东亚局势。在台湾议题上抛出“台海冲突或构成日本存亡危机事态”的挑衅言论、引发中国强烈反对后,她又于11月10日在日本国会众议院会议上宣称,“竹岛(韩国称独岛)无论是基于历史事实,还是国际法,都是日本的固有领土,我们将基于这一立场进行应对”。这番言论

    2025年11月17日
    56
  • 习近平致电祝贺卡斯特当选智利总统

    新华社北京12月22日电12月22日,国家主席习近平致电卡斯特,祝贺他当选智利共和国总统。习近平指出,智利是首个同新中国建交的南美国家,两国始终坚持相互尊重、平等相待、互利共赢,在涉及彼此核心利益和重大关切问题上相互理解和支持,各领域务实合作成果丰硕,给两国人民带来了实实在在的福祉。中智关系长期走

    2025年12月22日
    35
  • 河北一女子产子55天后被丈夫家暴,监控拍下拖拽拳打持菜刀,警方行政立案后妇联介入,受害女子提出离婚诉求

    近日,关于河北张家口桥西区“女子产子后50多天被丈夫施暴”的监控视频引发热议。1月5日,极目新闻记者获悉,当地警方和妇联已介入调查。男子打人(监控截图)一段36秒长的家庭监控视频显示,一名男子在餐桌旁打了女子4拳,一位老人站在中间劝阻。男子又在窗边多次挥拳击打女子,两位老人在一旁劝阻时,其中一位老人

    2026年01月06日
    26
  • 56岁仍能在图书馆静坐6小时?她靠这项运动,活成了年轻人的榜样

    清晨六点的北京,我刚结束10公里晨跑。手机弹出儿子的消息:“妈,体检报告出来了,各项指标比去年还稳!”笑着回了句“那是”,转身走进图书馆。一坐就是6小时,从《诗经》的“蒹葭苍苍”读到《跑步的力量》的“多巴胺分泌”,笔尖在笔记本上沙沙游走,连管理员都打趣:“大姐,你这专注力,年轻人都得服。”旁人总问:

    2026年01月17日
    10
  • 不到24小时,以色列迎来6个噩耗,以色列军官被斩首,以总理大怒

    按照以色列国防部在6月24日的表态,持续了12天的伊以大战,是以“伊朗遭到致命打击,以色列全胜”的结果结束的。以色列超预期完成了目标,包括瘫痪伊朗的防空能力、摧毁数百枚弹道导弹、破坏伊朗最关键的核设施、杀死十几名伊朗核科学家与大批伊朗将领。当然,与此同时,美国与伊朗也在庆祝胜利。伊朗认为,伊朗革命卫

    2025年06月25日
    186
  • 【北京西城区确诊病例,北京西城区确诊患者活动轨迹】

    北京西城区疫情在哪里北京市大兴区北兴路东段2号是大兴区集中隔离点之一。西城区六铺炕二巷1号院是西城区集中隔离点之一。为了防范境外疫情输入和扩散,首都联防联控协调机制已采取更加严密有力的措施。具体措施包括,所有入境人员必须严格填写《健康申明卡》。自3月16日零时起,所有境外进京人员需转送至集

    2025年06月29日
    191
  • 玩家必看攻略“微乐广东麻将如何赢的秘诀(专用辅牌神器免安装)

    软件神器超燃!微乐捉鸡麻将控牌器(自建房胜负规律)“我们专注于各类软件定制开发,已成功研发高效实用的软件系统。软件定制开发服务用获取专业解决方案。”微乐捉鸡麻将控牌器是一款可以让一直输的玩家,快速成为一个“必胜”的ai辅助神器,有需要的用户可以

    2025年09月09日
    94

发表回复

本站作者后才能评论

评论列表(4条)

  • 春翌岍
    春翌岍 2025年12月04日

    我是视听号的签约作者“春翌岍”!

  • 春翌岍
    春翌岍 2025年12月04日

    希望本篇文章《为什么给机器人装上昂贵的触觉传感器,反而让它变笨了?》能对你有所帮助!

  • 春翌岍
    春翌岍 2025年12月04日

    本站[视听号]内容主要涵盖:国足,欧洲杯,世界杯,篮球,欧冠,亚冠,英超,足球,综合体育

  • 春翌岍
    春翌岍 2025年12月04日

    本文概览:这项工作由伊利诺伊大学香槟分校 (UIUC)、哈佛大学、哥伦比亚大学和麻省理工学院 (MIT) 的合作完成 。论文标题:Multi-Modal Manipulation via...

    联系我们

    邮件:视听号@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们