华人澳洲中文论坛

热图推荐

    “趔趔趄趄”的机器狗,1小时就没了......

    [复制链接]

    2022-7-21 07:03:35 36 0



    图片来源@视觉中国
    文 | 学术头条为了避开捕食者,刚出世的长颈鹿或者马驹等植物必需学会用腿尽量快地走路。
    但是,学会准确协调腿部肌肉和肌腱,仍是要破费一些时间。
    最后,小植物重大依赖于天生的脊髓反射,静止管制反射帮忙它们在第一次尝试行走时防止摔倒和受伤。
    之后,它们必需学习更先进、更准确的肌肉管制,直到神经零碎终究顺应腿部肌肉和肌腱。
    最初,它们就像成年植物同样,不再会有不受管制的趔趔趄趄了。
    这个进程可能十分短(好比牛羊刚出世就会走路),也多是几天到几周(好比猫咪和狗子需求一些时间学习),也可能长达 1 年(好比人类幼儿学走路就很慢)。
    那末,问题来了,植物是如何学会行走并从磕磕绊绊中学习的?
    为此,马克斯·普朗克智能零碎钻研所(MPI-IS)的钻研团队进行了一项钻研,他们制作了一个四条腿、狗同样大小的机器人,但愿借此往返到这一问题。


    图|在跑步机下行走(素材来源:Morti)
    相干钻研论文以“Learning plastic matching of robot dynamics in closed-loop central pattern generators”为题,已颁发在迷信期刊 Nature Machine Intelligence 上。
    “作为工程师和机器人专家,咱们经过制作一个机器人来寻觅谜底,它拥有像植物同样的反射才能,并从过错中学习。” 论文第一作者、通信作者 Felix Ruppert 说。
    “假如植物跌倒了,这是一个过错吗?假如只产生一次,就不是过错。然而,假如它常常跌倒,就能为咱们提供一个权衡机器人行走才能的规范。”
    用算法优化“虚构脊髓”
    据论文形容,该机器狗名为 Morti,只用了一个小时学习走路,就很好地掌握了繁杂的腿部力学。


    图|机器狗 Morti(来源:MPI-IS)
    在这一过程当中,钻研团队利用一种贝叶斯优化算法来指点机器狗学习:丈量到的足部传感器信息与虚构脊髓模型的指标数据相婚配,脊髓模型作为顺序运转在机器人的“大脑”中。
    机器人经过不停对比发送和冀望的传感器信息、运转反射回路和调剂其静止管制模式来学习行走。
    该学习算法相似于中枢模式产生器(CPG)的管制参数。
    在人类和植物中,这些 CPG 是脊髓中的神经元网络,它们发生周期性的肌肉膨胀,而不需求来自卑脑的输出。CPG 网络帮忙发生有节拍的工作,好比走路、眨眼或消化。
    另外,反射是由衔接腿部传感器和脊髓的硬编码神经通路触发的有意识的静止管制行动。
    只有小植物在一个完善的立体下行走,CPG 就足以管制来自脊髓的静止信号。
    但是,仅仅是与高空的一次小碰撞,就可以改动它们的行走形式。
    这时候,它们本身的(机体)反射开始发扬作用,帮忙调剂静止模式,避免摔倒。
    这些静止信号的瞬间变动是可逆的,或者说是“有弹性的”,静止模式在遭到调控后会恢复到原来的状态。
    然而,假如它们在屡次循环的静止后依然会磕磕绊绊——只管是被动的反射——那末这些静止模式必需从新学习,并使其“不成逆转”。
    在植物刚出世的阶段,它们的 CPG 尚无调剂好,它们在平整或不屈的地形上都会表示得趔趔趄趄。然而,这些植物很快就可以学会 CPG 和反射是如何管制腿部肌肉和肌腱的。


    (来源:MPI-IS)
    拉布拉多犬大小的机器狗“Morti”也是如斯。
    更首要的是,Morti 优化静止模式的速度比小植物还快,只需求大约一小时。
    Morti 的 CPG 是在一台管制机器人腿部静止的小型计算机上摹拟的。
    这个虚构脊髓被搁置在 Morti 的背部,也就是头部所在的地位。
    在机器人安稳行走的过程当中,Morti 足部的传感器数据会不停与它本身 CPG 预测的预期触地进行对比。
    假如机器人摔倒了,学习算法会改动腿先后摆动的间隔、速度以及腿在高空上的长度。


    调剂后的静止也会告知 Morti 之后如何更好天时用腿部力学。
    在学习过程当中,Morti 的 CPG 会发送顺应的静止信号来优化本身行走,进而增加磕磕绊绊。
    在这个框架中,Morti 的虚构脊髓其实不理解本身的腿部设计、能源来源和身材构造。因为对本身物理构造无所不知,Morti 短少一个机器人“模型”。
    对此,Ruppert 解释说:“Morti 实际上其实不知道它的腿部解剖构造以及它们是如何任务的。”
    “CPG 相似于自然提供的内置自动行走智能,咱们曾经将其转移到机器人身上。计算机发生信号管制腿部的马达,机器人就会行走和跌倒。数据从传感器传到虚构脊髓,与 CPG 数据进行比较。假如传感器数据与预期数据不婚配,学习算法就会改动行走行动,直到机器人走得很好,不会绊倒。学习进程的中心部份是改动 CPG 的输入,同时放弃反映的活泼,并监测机器人的趔趔趄趄。”
    节能的机器狗管制
    Morti 的小型计算机外行走过程当中只损耗了 5 瓦的能量。
    然而,大少数现有的工业四足机器人对电力的需要要大很多。它们的管制器使用机器人的模型,按照机器人的准确品质和身材几何外形进行编码,通常损耗几十到几百瓦。
    两品种型的机器人都是静态高效运转的,但 Morti 的能量损耗要低很多,并且还提供了对植物解剖学的首要见地。
    “咱们不克不及等闲地钻研活体植物的脊髓。但咱们能够在机器人中建设一个模型,”论文作者之一 Alexander Badri-Spr?witz 说。
    “咱们知道这些 CPG 存在于许多植物身上。咱们知道反射是外在的;但如何将二者结合起来,让植物学习反射和 CPG 静止?这是机器人与生物学穿插畛域的根底性钻研。针对生物学无奈回答的问题,咱们的机器人模型给出了谜底。”
    在将来的任务中,钻研团队将持续扩展 CPG,在发生臀部轨迹时将机体俯仰举措斟酌其中。经过惯性丈量安装,机体俯仰能够反馈到 CPG 中。
    参考材料:
    http://www.nature.com/articles/s42256-022-00505-4

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    中级会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题45

    帖子56

    积分251

    图文推荐