返回顶部
返回首页
返回首页
今天是    | 政策法规 | 行业应用 |
home 您现在的位置: 首页 >服务与娱乐机器人>技术中心 > 详细信息
机器学习确保机器人在未知领域的表现
2020年11月23日    阅读量:2727     新闻来源:中网信息    |  投稿

一辆小型无人机在一个空旷的地方进行试飞,里面装满了随意放置的纸板筒,它们充当树木,人或建筑物的替身。


控制无人机的算法已在一千个模拟的载满障碍的路线上进行了训练,但从未见过这样的路线。仍然,十分之九的飞机缩小了品脱大小的飞机,避开了其路径上的所有障碍中国机械网okmao.com


机器学习确保机器人在未知领域的表现 中网信息


该实验为现代机器人技术中的关键挑战提供了试验平台:保证在新颖环境中运行的自动化机器人的安全性和成功的能力。随着工程师越来越多地使用机器学习方法来开发适应性强的机器人,普林斯顿大学研究人员的新工作在各种障碍和约束条件下为机器人提供此类保证方面取得了进展。


“在过去的十年左右的时间里,在机器人技术方面,机器学习获得了巨大的兴奋和进步,主要是因为它允许您处理丰富的感官输入,例如来自机器人相机的感觉输入,并映射这些复杂的输入普林斯顿大学机械与航空航天工程学助理教授阿尼鲁达玛(Anirudha Majumdar)说,要采取行动。


但是,基于机器学习的机器人控制算法存在过拟合其训练数据的风险,这可能会使算法在遇到与训练时输入不同的输入时效率降低。Majumdar的智能机器人运动实验室通过扩展用于训练机器人控制策略的可用工具套件,并量化了在新颖环境中执行机器人的可能成功和安全性,来应对这一挑战。


在三篇新论文中,研究人员将其他领域的机器学习框架应用于机器人运动和操纵领域。他们转向一般化理论,该理论通常用于将单个输入映射到单个输出的上下文中,例如自动图像标记。新方法是最早将泛化理论应用于更复杂的任务的方法之一,以确保在陌生环境下机器人的性能。


Majumdar说,虽然其他方法在更严格的假设下提供了此类保证,但该团队的方法为新颖环境中的性能提供了更广泛适用的保证。


普林斯顿大学的研究人员将来自其他领域的机器学习框架应用于机器人的运动和操纵领域,将泛化理论应用于确保机器人在陌生环境中的性能的复杂任务。


作为原理证明,研究人员通过评估一种名为“鹦鹉秋千”的小型无人驾驶飞机沿着60英尺长的长满纸板筒的走廊飞行时的避障能力,对该技术进行了验证。无人机控制策略的保证成功率为88.4%,并且在20项试验中的18项(90%)中避免了障碍。


在第一篇论文中,该团队证明了应用机器学习框架的原理,并在模拟中测试了他们的方法,其中包括轮式车辆行驶在充满障碍物的空间中,以及机械臂抓住桌子上的物体。


他们还通过评估一种称为“鹦鹉秋千”(组合式四旋翼飞机和固定翼飞机)的小型无人机在飞行时长60英尺长,上面布满纸板筒的走廊上的避障情况,从而对该技术进行了验证。无人机控制策略的保证成功率为88.4%,并且在20项试验中的18项(90%)中避免了障碍。

 

该研究成果由Majumdar合着,于10月3日发表在《国际机器人研究杂志》上。Alec Farid,机械和航空工程专业的研究生;以及普林斯顿大学2021年级计算机科学专业讲师Anoopkumar Sonar。


Farid表示,将其他领域的机器学习技术应用于机器人技术时,“您需要满足许多特殊的假设,其中之一是说您希望看到的环境与您的策略所处的环境有多相似。除了证明我们可以在机器人环境中做到这一点之外,我们还集中精力尝试扩大可以提供保证的环境类型。”


“根据具体任务,我们能够在新环境中提供大约80%到95%的成功率,但是如果您要在实际环境中部署[无人驾驶飞机],那么95 %可能还不够好,” Majumdar说。“我认为这是最大的挑战之一,也是我们正在积极努力的挑战。”


加州洛斯阿尔托斯市丰田研究所高级研究科学家戴宏开说,尽管如此,该团队的方法仍代表了在看不见的环境中运行的机器人在通用保证方面急需的进展。


普林斯顿大学的研究人员使用模仿学习来提高基于机器学习的机器人控制策略的成功率。模拟实验包括(1)负责抓握和提起各种尺寸,形状和材料的杯子的机械手;(2)手臂将盒子推过桌子;(3)轮式机器人在类似居家的环境中在家具周围导航。


研究人员将从抓杯子和推箱子的任务中学到的政策部署到实验室的机械臂上,该机器手臂通过抓住两个手指状抓手之间的边缘来捡起25个不同的杯子。


没有参加这项研究的戴说:“这些保证对于许多对安全至关重要的应用至关重要,例如自动驾驶汽车和无人驾驶飞机,在这些应用中,训练集无法涵盖所有??可能的情况。” “保证书告诉我们,在看不见的情况下,一项政策仍然有可能表现得相当不错,从而在失败的风险过高的情况下,对该政策建立了信心。”


在将于11月18日在虚拟机器人学习大会上发表的其他两篇论文中,研究人员研究了其他改进措施,以使机器人控制策略更接近于实际部署所需的保证。一篇论文使用了模仿学习,其中人类的“专家”通过手动引导模拟机器人拾取各种物体或在有障碍物的不同空间中移动来提供训练数据。这种方法可以提高基于机器学习的控制策略的成功率。


为了提供培训数据,机械和航空航天工程专业的研究生艾伦·雷恩(Allen Ren)使用3D电脑鼠标来控制模拟的机械臂,以抓取和提起各种尺寸,形状和材料的杯子。其他模仿学习实验包括用手臂将盒子推过桌子,以及模拟轮式机器人在类似居家环境中的家具周围漫游的实验。


研究人员将从抓杯子和推箱子的任务中学到的政策部署到实验室的机械臂上,该机器手臂通过抓住两个手指状抓手之间的边缘来捡起25个不同的杯子,而没有像以前那样握住手柄人类的意愿。在推箱子的例子中,该策略在较轻松的任务上获得了93%的成功,在较困难的任务上获得了80%的成功。


任志刚说:“我们在桌子上方有一台摄像头,可以看到环境并每秒拍摄五次照片。” “我们的政策培训模拟将捕获此图像,并输出机器人应采取的动作,然后我们有一个控制器,可根据模型的输出将手臂移动到所需位置。”


普林斯顿大学的研究人员展示了基于视觉的计划器的开发,该计划器为飞行或行走的机器人在各种环境中执行计划的运动顺序提供了保证。他们评估了以视觉为基础的计划者的模拟情况,其中包括无人驾驶飞机绕障碍物行驶以及四足机器人穿越坡度高达35度的崎terrain地形。


第三篇论文展示了基于视觉的计划器的开发,该计划器为飞行或行走的机器人在各种环境中执行计划的运动顺序提供了保证。为计划中的运动生成控制策略带来了一个新的规模问题-需要优化具有数千个而非数百个维度的基于视觉的策略。


机械和航空工程学的博士后研究主要作者Sushant Veer说:“这需要提出一些新的算法工具,以便能够解决该维数问题,并且仍然能够提供强大的泛化保证。”


Veer策略的一个关键方面是运动原语的使用,在运动原语中,例如,一条策略指示机器人直行或转弯,而不是为每个运动指定扭矩或速度。Majumdar说,缩小可能采取的行动的空间使计划过程在计算上更加易于处理。


Veer和Majumdar评估了基于视觉的规划师,他们模拟了无人驾驶飞机绕过障碍物和四足机器人穿越坡度高达35度的崎terrain地形,“这是一个非常具有挑战性的问题,许多机器人技术人员仍在尝试解决。”


在这项研究中,有腿机器人在看不见的测试环境中获得了80%的成功率。研究人员正在努力进一步改善其策略的保证,并在实验室中的真实机器人上评估策略的性能。


标签:行业资讯今日头条产品资讯机械商道机械应用人工智能技术中心机器人服务与娱乐机器人配件与装备系统及软件
免责声明: 本文仅代表作者本人观点,与本网无关。本网对文中陈述、观点判断保持中立,不对所包含内容的准确性、可靠性或完整性提供任何明示或暗示的保证。请读者仅作参考,并请自行承担全部责任。本网转载自其它媒体的信息,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。如因作品内容、版权和其它问题需要同本网联系的,请在一周内进行,以便我们及时处理。客服邮箱:service@cnso360.com | 客服QQ:23341571

全站地图

深圳网络警察报警平台 深圳网络警
察报警平台

公共信息安全网络监察 公共信息安
全网络监察

经营性网站备案信息 经营性网站
备案信息

中国互联网举报中心 中国互联网
举报中心

中国文明网传播文明 中国文明网
传播文明

深圳市市场监督管理局企业主体身份公示 工商网监
电子标识