近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能决策算法的扩展性和适用性。
多智能体系统主要以庞大的智能体交互数据为基础,利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务,其核心范式是多智能体强化学习。
“比如一个无人机编队,每架无人机都由人工智能控制,我们把每架飞机的控制器叫作智能体,这个无人机编队由多个智能体构成,就是一个多智能体系统。”论文第一作者、北京大学人工智能研究院博士生马成栋解释。
马成栋说,在真实大规模系统中,各个控制单位之间、控制单位与环境之间的交互成本往往非常高昂。这些系统中经常存在客观通信限制,如通信距离太远、全局通信有隐私泄露风险、通信能耗限制等。控制单位之间难以实现全局信息交换,阻碍了人工智能决策算法在大规模系统中的扩展和应用。
当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。
马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。
论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更容易求解的问题。得益于此,即使在样本数据和信息交互受限的情况下,大型人工智能系统也能展现令人满意的决策性能。
研究团队在较为复杂的城市交通和电力网络中,对包含数百个智能体的场景进行了测试。结果显示,与中心化多智能体学习方法相比,去中心化的方法可将信息交换成本降低70%或更多。而且,随着智能体数量不断增长,这一比例还会显著下降。同时,样本效率可提升50%以上。
“这一研究成果对于将人工智能模型扩展到大型电力网络、城市交通信号控制等大规模多智能体系统具有重要价值。”马成栋举例说,在大型电网系统中,节点之间信息交换和传输过于频繁,难免会产生干扰。某些节点一旦发生故障,就会严重影响其他节点的性能。去中心化可以降低这一风险,提高电网系统稳定性和安全性。
近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能决策算法的扩展性和适用性。
多智能体系统主要以庞大的智能体交互数据为基础,利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务,其核心范式是多智能体强化学习。
“比如一个无人机编队,每架无人机都由人工智能控制,我们把每架飞机的控制器叫作智能体,这个无人机编队由多个智能体构成,就是一个多智能体系统。”论文第一作者、北京大学人工智能研究院博士生马成栋解释。
马成栋说,在真实大规模系统中,各个控制单位之间、控制单位与环境之间的交互成本往往非常高昂。这些系统中经常存在客观通信限制,如通信距离太远、全局通信有隐私泄露风险、通信能耗限制等。控制单位之间难以实现全局信息交换,阻碍了人工智能决策算法在大规模系统中的扩展和应用。
当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。
马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。
论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更容易求解的问题。得益于此,即使在样本数据和信息交互受限的情况下,大型人工智能系统也能展现令人满意的决策性能。
研究团队在较为复杂的城市交通和电力网络中,对包含数百个智能体的场景进行了测试。结果显示,与中心化多智能体学习方法相比,去中心化的方法可将信息交换成本降低70%或更多。而且,随着智能体数量不断增长,这一比例还会显著下降。同时,样本效率可提升50%以上。
“这一研究成果对于将人工智能模型扩展到大型电力网络、城市交通信号控制等大规模多智能体系统具有重要价值。”马成栋举例说,在大型电网系统中,节点之间信息交换和传输过于频繁,难免会产生干扰。某些节点一旦发生故障,就会严重影响其他节点的性能。去中心化可以降低这一风险,提高电网系统稳定性和安全性。
3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查、规范治疗、定期随访,提高大众爱肝护肝意识, 记者3月20日从西安交通大学第二附属医院获悉,该院皮肤病院夏育民教授科研团队研究设计了一种靶向抗双链抗体的D型模拟肽(D-ALW多肽)纳米微粒,成功应用于MRL/lpr红斑狼疮小鼠模型的治疗,为目前红斑 3月22日消息,xiaomi集团的卢伟冰在微博上表示,xiaomiCivi 4 Pro有可能是2024年最轻薄的电话。这款电话的厚度仅为7.45mm,重量为179.3g。尽管拥有超轻薄的机身,但Civi 4 Pro仍搭载了一块容量为4700mAh 记者从中国科学院新疆天文台获悉,近期南山26米射电望远镜在参与欧洲VLBI网组织的联测中,首次成功运用4Gbps宽带、高码率VLBI技术获得干涉条纹。相较于2Gbps观测,该技术理论上可将图像信噪比提升 为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科学技术协会(以下简称“北京市科协”)在北京科 近日,民航华东地区管理局向峰飞科技公司颁发V2000CG无人驾驶航空器系统型号合格证,这也是中国民航系统颁发的首个无人驾驶吨级电动垂直起降航空器型号合格证。航空器型号合格证取证是保障航空 。本文链接:新研究提升人工智能决策算法适用性http://www.sushuapos.com/show-2-8454-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 珠海率先建成海上智能装备测试场5G专网
下一篇: 我国首个脑血管病大模型问世