近日,国际顶级学术期刊<Science Robotics >发表了朱松纯团队(UCLA袁路遥、高晓丰、北京通用人工智能研究院郑子隆、北京大学人工智能研究院朱毅鑫等作者)的最新研究成果——实时双向人机价值对齐 In-situ bidirectional human-robotvalue alignment。论文同时被Science官网和Science Robotics官网头条刊登。
这项技术构建出一种机器实时理解人类价值观的计算框架,让机器人与人类用户通过实时沟通完成一系列复杂人机协作任务。这一研究可谓为机器立“心”,让AI(人工智能)赋能机器人“读懂”人类价值观。这项研究涵盖了认知推理、自然语言处理、机器学习、机器人学等多学科领域。
据了解,当今广泛应用的AI系统是一种被动的智能,只能机械地按照人类给定的任务行事,缺乏像人类一样的认知和推理能力以及情感和价值观。在缺“心”的情况下,AI很难理解人类真正的意图及价值需求,自然也就难以获取人类的信任、融入社会。
这个问题也被称为价值对齐(value alignment),即如何保证人工智能在执行任务过程中所实现的价值和用户所在意的价值是一致的?
可以说,价值对齐是人机协作过程中达成共识(common ground)的基础,具有非常重要的研究价值。价值对齐也是未来的一个重要发展方向,是让机器实现“自主智能”的关键所在,也是实现通用人工智能的必经之路。
在发现之前的研究范式存在局限性之后,朱松纯带领研究团队转换赛道,让AI系统按照人的方式自主定义任务,“学习”人从自身的价值需求出发,由此为机器立“心”,让AI学会人的价值函数,具有实时对齐当前人类价值目标的能力,探索出“小数据,大任务”的范式。