【新视点】新研究可有效提升人工智能决策算法的适用性
发布时间:2024-09-14 发布来源:科技日报
近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能决策算法的扩展性和适用性。
多智能体系统主要以庞大的智能体交互数据为基础,利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务,其核心范式是多智能体强化学习。当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。
据论文作者介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更容易求解的问题。得益于此,即使在样本数据和信息交互受限的情况下,大型人工智能系统也能展现令人满意的决策性能。
研究团队在较为复杂的城市交通和电力网络中,对包含数百个智能体的场景进行了测试。结果显示,与中心化多智能体学习方法相比,去中心化的方法可将信息交换成本降低70%或更多。而且,随着智能体数量不断增长,这一比例还会显著下降。同时,样本效率可提升50%以上。这一研究成果对于将人工智能模型扩展到大型电力网络、城市交通信号控制等大规模多智能体系统具有重要价值。
图片来源|东西南北杂志社
(声明:本号所发内容仅作为信息传递之目的,版权归创作者所有,如有不妥请及时联系删除,谢谢。)