最新新闻:

AI研究人员挑战机器人在仿真中骑滑板

时间:2020-10-22 10:52:42来源:互联网

AI研究人员表示,他们已经创建了一个控制四足机器人的框架,该框架比传统的基于模型的机器人足步态控制具有更高的能效和适应性。为了演示可实时适应条件的框架的强大特性,人工智能研究人员使该系统在无摩擦的表面上滑动以模仿香蕉皮,骑滑板并在跑步机上行走时爬上桥。Nvidia发言人告诉VentureBeat,由于COVID-19限制了办公室员工的人数,因此在现实生活中仅进行了无摩擦表面测试。发言人说,所有其他挑战都发生在模拟中。(在现实生活中使用模拟系统之前,通常将其用作训练数据。)

“我们的框架学习了一种控制器,该控制器可以适应瞬息万变的环境变化,包括培训期间未见过的新颖场景。与基准方法相比,学习型控制器的能效提高了85%,并且更坚固。“在推理时,高级控制器仅需要评估一个小型的多层神经网络,避免使用昂贵的模型预测控制(MPC)策略,否则可能需要为长期性能进行优化。”

使用带两个可独立改变速度的履带的皮带跑步机在模拟中训练了四足模型。然后,将模拟培训内容转移到现实世界中的Laikago机器人中。Nvidia周一发布了模拟和实验室工作的视频,同时还为处于测试阶段的工程师揭开了AI驱动的视频会议服务Maxine和Omniverse模拟环境的面纱。

一周前在预印本仓库arXiv上发表了一篇详细介绍控制四足动物腿的框架的论文。来自英伟达的AI研究人员;加州理工学院;德克萨斯大学奥斯汀分校多伦多大学的媒介研究所对此论文做出了贡献。该框架结合了使用强化学习的高级控制器和基于模型的低级控制器。

“通过利用这两种范例的优势,我们获得了一种接触自适应控制器,该控制器比采用固定接触顺序的控制器更具鲁棒性和能源效率,”该论文写道。

研究人员认为,许多用于控制机械手腿的网络是固定的,因此无法适应新的情况,而自适应网络通常会消耗大量能源。他们说,通过强化学习创建的运动系统通常不如基于模型的方法更健壮,需要大量的训练样本,或者使用复杂的方法来奖励特工。

今年早些时候,在苏黎世联邦理工学院的人工智能研究人员国际会议(CRA)上,苏黎世联邦理工学院的AI研究人员对DeepGait进行了详细介绍,该AI接受了强化学习方面的训练,可以做一些事情,例如跨度过长的差距和在崎uneven的地形上行走。

声明:文章仅代表原作者观点,不代表本站立场;如有侵权、违规,可直接反馈本站,我们将会作修改或删除处理。

图文推荐

热点排行

精彩文章

热门推荐