火狐体育|伯克利和Deepmind前赴后继,只为教出一个会做家务的机器人?

激光雕刻机 | 2021-06-27

火狐体育

【火狐体育直播】新年伊始,伯克利爆发了新的进步。他们通过爬上一段楼梯,教会机器人做家务的能力。在最近的一篇论文中,伯克利解释了他们如何让机器学会背诵人类的潜台词或唯一意义,而不是愚蠢地按照字面意义或奖励系统机械地移动。

比如餐桌机器人上菜的时候,不会为了获得尽可能多的奖励而告诉逃离酒柜,或者在供电等紧急情况下暂停上菜,而不会为了获得尽可能多的奖励而马不停蹄的送菜(末端的一个盘子系统不会获得奖励)。甚至有可能需要把盘子捅破,这样才能得到更好的“盘子”(奖励).看到这个新闻,我的第一反应是,这个机器人真的很笨,我两岁的侄子就能做这么简单的任务。第二种反应是伯克利对教机器人做家务的执念不可避免的太深。

我还开发了一个引擎,教机器人砌砖板,做衣服,离开桌面。简而言之,让机器人参与家务是不可能的。

除了伯克利,还有Deepmind想挑战家务技能。去年2月,Deepmind明确提出了一种新的自学范式“规划辅助控制SAC-X”,帮助机器人学会整理桌子和装衣服。

不久前,佐治亚理工学院的研究人员还发表了一种新的增强型自学算法,可以教机器人穿衣服。为什么那么多AI巨头踏上家务培训的道路?以后能不能像《底特律》中的卡拉小姐一样享受开朗能干的家用机器人?本文将试图解释这些困惑。

三十六家务活:家用机器人控制什么技能?首先,我们来思考一下,在这么多人类高手和AI巨人的帮助下,小家用机器人学到了什么技能。再来说说“管家狂人”伯克利。早在去年,我们就已经了解了伯克利的标准化预测模型,它可以帮助机器人自主学习和控制许多标准化的基本技能,并在此基础上学习和预测主人的意图和任务的共性,使其能够继续类比执行常见的任务类别,茁壮成长为一名出色的“家务全能者”。

比如拉链短裤毛巾,苹果毕竟,整理桌面,等等。伯克利还发布了深度自学习模型Dex-NET,该模型基于角点检测和捕捉策略,使机器人完成了砖片的艰巨任务。

最值得一提的是新的研究成果“偏好优化模型”。机器人不仅可以完成标准化任务,还可以推断出优于解的、具有适应环境的隐藏条件的简单现实环境。

比如,在常规的“演员-评论家”增强型自学习反馈机制中,如果主人拒绝机器人导航系统前往紫门,机器人不会自由选择最短路径(传统的拟合解),忽略了它不会在路上刺破花瓶。因为机器人无法知道主人是否在乎花瓶不会被刺穿。但如果机器人能模拟并练习过去再次发生的不道德轨迹,比如主人还在转花瓶,说明她尊重花瓶的原状,那么可以推断穿越花瓶是最有可能获得奖励的目标,应该坚决坚持。机器人具有洞察隐藏条件的能力,这意味着它们可以从一种状态中学习人类的偏好。

火狐体育直播

系统需要详细列出真实环境中所有的因果联系和条件。奖励函数还是线性的,机械的。机器人可以自律模拟和自学过去的经验,识别和应对未知的动态环境。

对于做家务的任务,可以说是鉴别主人爱好,开始写作业的必备技能。与伯克利相比,Deepmind只是对医疗这一高度复杂的任务更感兴趣。但这并不妨碍它在内政领域的闪烁和断断续续。Deepmind的“计划辅助控制SAC-X”模型帮助机器人学习探索和控制家务的基本技能。

就像婴儿在乌龟和行走之前必须发展谈判和平衡的能力一样,SAC-X也帮助机器掌握几项核心视觉运动技能。 比如使用模拟手臂,按照准确的顺序,即使你没见过这些任务,也可以从零开始学习,根据拒绝一起成功推荐对象。

这样,不用额外编程,就可以完成整理桌面的简单任务。此外,乔治亚理工学院将布料引入自学框架,教授机器人如何穿衣打扮的论文也非常巧妙。

因为衣服的布料材质不同,所以穿衣服的动作无法跟随特定的运动轨迹,也不会与布料产生简单的互动变化。机器人必须进行大量的运动,模拟和优化每一个子任务(撕边、展平衣服的边角等)。

),并在大幅度变化的环境条件下自行学习稳定创新的控制策略。终于,穿不同衣服的任务目标完成了。

无论衬衫、套头衫还是外套,都是适当的液体!一起听,好像大部分家用机器人都可以互相竞争,但值得注意的是,现实中需要看到的家用机器人,工作起来还是又快又笨。比如一个伯克利设计的家庭助手,由Rethink Robotics开发的,需要15分钟就能造出一条毛巾;加州FoldiMate销售的智能折叠机,可以按照程序摆放必要的衣服方格,但必须人工摆放在摊位上,并没有节省多少人力,价格还是低了980美元左右(约7000人民币).……emmmm自己还有足够的温饱。

不是比人快就是比人贵,机器人做家务性价比太低。那么,既然我们无法认识老板,那么教会机器人自己学习这些技能又有什么意义呢?为什么做家务,去工厂,搬砖头?楚,一个如此多才多艺的研究员,如果他去教小学生,就能通过清华。我觉得如果我敢去工厂搬砖,也可以减轻劳动力的紧张。

火狐体育直播

为什么我要和家务较劲?原因是国内任务从无到有获得了自学和简单任务控制的训练环境,这对规范机器智能非常重要。首先,家务任务的真实性和多样性帮助代理人学会如何用最先验的科学知识解决简单的问题。先验科学知识是指一种元能力,不依赖于经验总结(类似于写好程序,从结果推断过程),通过观察学习推理小说和辨别。机器人没有这种“天然”的科学知识,但我们似乎不可能对机器人服务的每一个家庭、每一个可能的任务进行预编程。

这时,训练机器人的标准化能力就变得最为关键。虽然有一天机器将无法像人类一样享受超凡的能力和多功能性,但它们可以在各种学科和工作中表现出相似的特征。但是,在很多横向领域,比如工业、家务、语言等。

具有强大超越能力的机器代理可以低成本、低适应性和灵活性地完成任务和解决问题。另外,家政任务是集视觉、触觉、动作、关节控制等为一体的任务。非常全面。这是一个其他片段无法使用的环境,对于训练多功能协同代理非常有帮助。

比如Berkeley教机器人从垃圾桶里丢下看不见的物体,所以必须通过摄像头采集深度图像,形成模拟数据集,然后利用该数据集训练质量卷积神经网络(GQ-CNN)对物体图像进行分割,确认捕捉尝试成功的可能性,最后形成捕捉成功概率最低的策略,然后开发抓手关节的动态仪表控制,让操作者最终完成。一个培训,多种收入。

更重要的是,与工业机器人、电子游戏等相比。家务劳动的操作者环境更加牢固,充满变化,任务的主观预期和隐含意义更加难以界定和预测,无形中增加了训练的可玩性。

同时,家政任务的培训成本相对较低,更容易被大众解读,社会效益和营销价值都有所收获。 比起《Dota》中拳打脚踢机器狗,强奸真实玩家,让机器做家务才是最政治精准,最便宜,最好的训练方法。醉酒的意义:做完家务后这些学习有什么用?国产机器人的背后,其实解释的是agent origin的本质逻辑:在简单的环境中,你可以找到合理的解决方案,解决随机的、非结构化的问题,你可以安全地与环境交互,高效地完成任务。明确一点,训练国产机器人主要有三个好处:第一,培养出更标准化智能的机器人,在没有过多引导的情况下继续执行一系列任务,提高机器自动化的安全性和工作效率。

二是帮助开发分层规划、感官、推理小说的算法,可以帮助解决自动驾驶、工业自动化、智能物联网等领域的问题;三是推动零样本自学、少样本自学等技术变革。在没有外部奖励信号的情况下,该算法还可以推断小说的不道德意图,可以明显改善电子商务和内容产品推荐系统的体验。这样大家就不难理解,为什么家务不会成为标准化代理人健康道路上不可跨越的垫脚石。最后,可能会有人想问:如果你不爱人不做家务,我只在乎机器人什么时候能进我家给我铺床。

本文来源:火狐体育直播-www.sierrapol.com