一种机器人群体合作的进化机器人方法

2022-09-04 15:28:01 编辑：卓华露来源：

导读重组，由于交配或结合来自不同生物体的DNA片段而重新排列遗传物质，具有许多进化上的优势。例如，它允许生物体从其基因组中去除有害的突变...

重组，由于交配或结合来自不同生物体的DNA片段而重新排列遗传物质，具有许多进化上的优势。例如，它允许生物体从其基因组中去除有害的突变，并承担更有用的突变。

洛林大学(Universite de Lorraine)的研究员阿姆·布马扎(Amine Boumaza)最近试图将这一过程应用于在线体现的进化机器人，这是一个机器人领域，专注于在机器人中复制进化理论。在他的论文中，发表在GECCO‘19遗传和进化计算会议期刊上，他开发了一个受进化启发的重组操作员，并对其进行了三项任务的培训，这些任务需要多个机器人之间的协作。

布马扎说：“我的研究落在AI这个更广泛的课题上，更具体地说，就是理解我们如何能够设计出能学会完成有趣任务的代理人。“这个研究课题不是新的，而是比较老的，最近因为深度学习的成果给人留下了深刻的印象，引起了很多人的关注。在我的例子中，我对群体机器人更感兴趣，目标是让大量小型机器人合作解决一项任务，并适应其环境的变化。”

布马扎被进化策略，特别是重组策略所吸引，这些策略使生物体能够更好地面对生命的挑战，他开始研究是否可以将类似的机制应用于机器人方法。他的假设是，如果在机器人中成功复制，重组将提高它们的性能和效率。

布马扎说：“当我们谈到机器人代理时，我们通常假设一个物理实体体现在一个环境中(例如一个房间里的真空清洁机器人)。“这名特工使用一组传感器(障碍传感器、摄像机等)感知周围环境。)，这可以给它某种环境的表征。该剂还可以在环境中使用效应剂(马达、手臂、清洁刷等)。这些操作是一个计算的结果，它是我们通常所称的控制器(即控制器)的输出。某种决策程序)。

控制器本质上是一个程序，它处理机器人通过其传感器获得的感知，并向其执行器输出命令。例如，在机器人吸尘器的情况下，控制器将处理有关其周围环境的信息，检测其前面是否有灰尘，然后产生输出，使机器人激活真空，并前进到吸尘器。

布马扎说：“采取进一步措施，我们还可以考虑在同一环境中可以进化的多个代理。“在这样的环境下为每个代理设计控制器是一个非常困难的问题，对于这个问题还没有有效的技术。在这种情况下，我们可以有很少的(例如，10到100个)复杂机器人，或者许多非常简单的机器人(例如，数百个)以通常来自昆虫行为的方式进行交互;这就是我们所说的群体机器人。”

当开发一个能够有效完成特定任务的机器人时，研究人员需要设计一个围绕该特定任务量身定做的控制器。如果机器人所要操作的环境是简单的，那么设计这个控制器可能相当容易，但大多数情况下，情况并非如此。

当考虑到多个机器人在给定的环境中交互时，这变得更加困难，如果不是不可能的话。其主要原因是，人类开发者不可能预测每个机器人将遇到的所有情况，以及处理每种情况的最有效的行动。幸运的是，近年来，机器学习的进步为机器人研究开辟了有趣的新可能性，允许开发人员集成能够持续学习的工具，本质上是训练控制器处理随时间推移的许多情况。

布马扎说：“以这种方式设计控制器的一种方法是使用进化算法，从松散的角度讲，它试图模仿物种的自然进化来进化机器人代理控制器。这是一个迭代过程，当动物更好地适应他们的环境时，控制器就会更好地解决任务。目标不是模拟自然进化，而是从中获得一些启发。”

进化机器人只是研究人员可以用来设计机器人控制器的许多技术之一。然而，近年来，进化方法越来越受欢迎，越来越多的研究旨在复制在动物和人类中观察到的进化策略。

布马扎说：“进化机器人技术有一些优势，比如我们不需要指定如何解决任务(它是由算法发现/学习的)，只需要指定一种方法来衡量任务执行得有多好。”它也有一些缺点，因为它是一个非常缓慢和计算密集的过程，可能很难在真正的机器人上执行。此外，这些方法通常对性能度量非常敏感，因为它们对代理人所学到的行为具有条件作用。

布马扎和该领域的其他研究人员一样，一直在试图开发新的方法来克服现有进化机器人技术的缺点。在他最近的研究中，他特别提出了一种新的“交配算子”的使用灵感来自重组，它可以提高机器人模拟中的收敛速度。这是一个了不起的成就，因为它最终可以减少将一种方法从模拟转移到真正的机器人所需的时间。

他将他的重组操作员应用于三个集体机器人任务：运动、物品收集和物品觅食。然后，他比较了使用纯突变版本的他的算法和不同的重组算子的性能。在他的实验中收集到的结果表明，如果设计正确，重组策略实际上可以改善一群机器人在他所考虑的所有任务中的适应性。

在未来，他提出的新的进化机器人方法可以用来提高机器人在需要多个代理之间协作的任务中的性能和适应性。然而，在此期间，布马扎计划在新任务上测试他的算法，以确定他在他关注的三个任务中观察到的改进是否仍然有效。

布马扎说：“如果我的方法能在真正的机器人上实现，也会很有趣。“从理论上讲，没有什么能阻止这一点，除了拥有大量的物理机器人，并接受处理‘现实差距’(即)。我们在模拟中看到的通常不是在现实中会发生的事情，因为模拟的简化。群机器人是关于数字的，一个机器人的失败不应该阻碍群。因此，为了最终确定这种方法的有效性，必须在实际上对物理机器人进行测试。

标签：

免责声明：本文由用户上传，如有侵权请联系删除！