家用机器人已经走进家庭,当您让它为您煮杯咖啡时,尽管它已经掌握了模拟厨房实践中的一些基本技能,包括打开水龙头、冲马桶、倾倒面粉盒等各种动作。虽然它可以做出很多动作,但实际有效动作却很有限,在面对新场景和新情况时,机器人如何判断哪些步骤是合理的呢?

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图1) data-backh="316" data-backw="562" data-cropselx1="0" data-cropselx2="553" data-cropsely1="0" data-cropsely2="311" data-ratio="0.5625" data-type="png" data-w="1280">

现在,有一个名为PIGINet的全新系统可以提供帮助,它旨在显著提升家用机器人的问题解决能力。麻省理工学院计算机科学与人工智能实验室的研究人员正在利用机器学习来改善传统任务规划的迭代过程,以减少必须考虑所有可能行动的情况。通过PIGINet,可消除无法满足无碰撞要求的任务计划,而只需要进行300到500个问题的训练,就可以将计划所需时间缩短50%至80%。

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图2) data-backh="311" data-backw="553" data-cropselx1="0" data-cropselx2="553" data-cropsely1="0" data-cropsely2="311" data-ratio="0.5625" data-type="png" data-w="1280">

通常情况下,机器人会尝试各种任务计划,并逐步改进其动作,直到找到可行的解决方案。然而,在存在可移动和铰接障碍物的情况下,这种过程可能非常低效和耗时。例如,您可能希望在烹饪后将所有的调味汁都放进橱柜。这个问题可能涉及2到8个步骤,具体取决于当时的情况。机器人是否需要打开多个橱柜门?橱柜内是否有需要移动的障碍物以腾出空间?如果机器人的速度太慢,甚至会导致食物烧焦。

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图3) data-backh="309" data-backw="578" data-cropselx1="0" data-cropselx2="578" data-cropsely1="0" data-cropsely2="325" data-ratio="0.5346534653465347" data-type="png" data-w="1010">

在传统设定上,家用机器人被设计成按照预设的程序执行任务,但这并不总是适用于多样化或不断变化的环境。这就是PIGINet的用武之地:它是一个神经网络,可以接收"计划、图像、目标和初始事实",然后预测任务计划的可行性,从而找到有效的动作方案。

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图4) data-backh="325" data-backw="578" data-cropselx1="0" data-cropselx2="578" data-cropsely1="0" data-cropsely2="325" data-ratio="0.5625" data-type="png" data-w="1280">

PIGINet采用变压器编码器,这是一种多功能的先进模型,专为处理数据序列而设计。在这个案例中,输入序列由有关当前考虑的任务计划、环境图像以及初始状态和目标的符号编码组成。编码器将这些信息结合起来,生成关于所选任务计划可行性的预测。

在厨房里,研究团队建立了数百个模拟环境,每个环境都具有不同的布局和特定的任务。这些任务涉及重新摆放柜台、冰箱、橱柜、水槽和炊具等物品。通过测量解决问题所需时间,研究人员将PIGINet与传统方法进行了比较。在较简单的场景中,PIGINet将计划时间缩短了80%。在计划序列较长且训练数据较少的复杂场景中,缩短了20%至50%的计划时间。

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图5) data-backh="369" data-backw="554" data-cropselx1="0" data-cropselx2="554" data-cropsely1="0" data-cropsely2="369" data-ratio="0.6666666666666666" data-type="png" data-w="900">

麻省理工学院CSAIL首席研究员Leslie Pack Kaelbling教授表示:"像PIGINet这样的系统利用数据驱动方法在高效处理常见案例的同时,仍然可以依赖于'第一原则'规划方法来验证基于学习的建议并解决新问题,提供了一种综合的解决方案,为各种问题提供了可靠且高效的通用解决方案。"

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图6) data-backh="311" data-backw="553" data-cropselx1="0" data-cropselx2="553" data-cropsely1="0" data-cropsely2="311" data-ratio="0.5620608899297423" data-type="png" data-w="854">

PIGINet使用多模态嵌入技术来处理输入序列,从而更好地表示和理解复杂的几何关系。使用图像数据有助于模型在不了解物体的三维网格的情况下掌握空间布局和物体配置,从而进行精确的碰撞检测,快速做出决策。

事半功倍?探讨人工智能如何帮助家用机器人合理规划时间(图7) data-backh="311" data-backw="553" data-cropselx1="0" data-cropselx2="553" data-cropsely1="0" data-cropsely2="311" data-ratio="0.5620608899297423" data-type="png" data-w="854">

在PIGINet的开发过程中,面临的主要挑战之一是缺乏充足的训练数据,因为所有可行和不可行的计划都需要由传统规划器生成,而传统规划器的速度通常很慢。然而,通过使用预训练的视觉语言模型和数据增强技巧,研究团队能够应对这一挑战。这种方法不仅在处理已知物体的问题上表现出令人印象深刻的计划时间缩短效果,而且还能够在处理以前未知物体时实现零点泛化。

-----------------END-------------------