近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能决策算法的扩展性和适用性。
多智能体系统主要以庞大的智能体交互数据为基础,利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务,其核心范式是多智能体强化学习。
“比如一个无人机编队,每架无人机都由人工智能控制,我们把每架飞机的控制器叫作智能体,这个无人机编队由多个智能体构成,就是一个多智能体系统。”论文第一作者、北京大学人工智能研究院博士生马成栋解释。
马成栋说,在真实大规模系统中,各个控制单位之间、控制单位与环境之间的交互成本往往非常高昂。这些系统中经常存在客观通信限制,如通信距离太远、全局通信有隐私泄露风险、通信能耗限制等。控制单位之间难以实现全局信息交换,阻碍了人工智能决策算法在大规模系统中的扩展和应用。
当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。
马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。
论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更容易求解的问题。得益于此,即使在样本数据和信息交互受限的情况下,大型人工智能系统也能展现令人满意的决策性能。
研究团队在较为复杂的城市交通和电力网络中,对包含数百个智能体的场景进行了测试。结果显示,与中心化多智能体学习方法相比,去中心化的方法可将信息交换成本降低70%或更多。而且,随着智能体数量不断增长,这一比例还会显著下降。同时,样本效率可提升50%以上。
“这一研究成果对于将人工智能模型扩展到大型电力网络、城市交通信号控制等大规模多智能体系统具有重要价值。”马成栋举例说,在大型电网系统中,节点之间信息交换和传输过于频繁,难免会产生干扰。某些节点一旦发生故障,就会严重影响其他节点的性能。去中心化可以降低这一风险,提高电网系统稳定性和安全性。
近日,由北京大学人工智能研究院、工学院、计算机学院和伦敦国王学院共同完成的论文——《大规模多智能体系统的高效强化学习》在国际学术期刊《自然·机器智能》上发表。这一成果首次在大规模多智能体系统中实现高效去中心化协同决策,有利于提升人工智能决策算法的扩展性和适用性。
多智能体系统主要以庞大的智能体交互数据为基础,利用大量计算资源驱动每个智能体学习如何与其他智能体合作执行复杂任务,其核心范式是多智能体强化学习。
“比如一个无人机编队,每架无人机都由人工智能控制,我们把每架飞机的控制器叫作智能体,这个无人机编队由多个智能体构成,就是一个多智能体系统。”论文第一作者、北京大学人工智能研究院博士生马成栋解释。
马成栋说,在真实大规模系统中,各个控制单位之间、控制单位与环境之间的交互成本往往非常高昂。这些系统中经常存在客观通信限制,如通信距离太远、全局通信有隐私泄露风险、通信能耗限制等。控制单位之间难以实现全局信息交换,阻碍了人工智能决策算法在大规模系统中的扩展和应用。
当前,去中心化的多智能体强化学习成为国际学术界的研究热点,其旨在探索一种算法,即在有限数据和资源条件下,将决策能力扩展到包含大量智能体的复杂真实系统中。
马成栋说,去中心化的多智能体强化学习,以不依赖全局信息的方式让每个智能体实现高效去中心化协同决策,展现出独特优势。
论文通讯作者、北京大学人工智能研究院助理教授杨耀东介绍,研究团队通过网络化结构解耦系统的全局动态特性,使智能体能独立学习局部状态转移、邻域信息价值和去中心化策略,将复杂的大规模决策难题转化为更容易求解的问题。得益于此,即使在样本数据和信息交互受限的情况下,大型人工智能系统也能展现令人满意的决策性能。
研究团队在较为复杂的城市交通和电力网络中,对包含数百个智能体的场景进行了测试。结果显示,与中心化多智能体学习方法相比,去中心化的方法可将信息交换成本降低70%或更多。而且,随着智能体数量不断增长,这一比例还会显著下降。同时,样本效率可提升50%以上。
“这一研究成果对于将人工智能模型扩展到大型电力网络、城市交通信号控制等大规模多智能体系统具有重要价值。”马成栋举例说,在大型电网系统中,节点之间信息交换和传输过于频繁,难免会产生干扰。某些节点一旦发生故障,就会严重影响其他节点的性能。去中心化可以降低这一风险,提高电网系统稳定性和安全性。
“当时是怎样选中低空经济这个领域,并且来深圳发展的?”面对这个关乎事业发展的问题,“95后”台青张晏纶坦言,“这是一场面试带来的惊喜。”张晏纶来自台湾台中市,本科就读于台湾成功大学机械工程 根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地图涵盖了大约130万个活跃类星体的精确空间 据中国科学院武汉植物园消息,我国科研人员在大别山区开展植物多样性科学考察时,发现了天门冬科天门冬属新物种,并将其命名为大别山天门冬。相关研究成果日前发表在国际知名植物分类学期刊《植物 美国加州理工学院喷气推进实验室的一个机器人专家团队,与卡内基梅隆大学机器人研究所科学家合作,开发出一种蛇形机器人,用于调查土星第六大卫星土卫二的地形,以寻找生命的“蛛丝马迹”。相关研究 30台发动机助进阶版“鹊桥”升空 中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入预定轨道。作为公共中继星平台,“鹊桥二号” 3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产品官刘作虎表示,2024年线上突破是OPPO中国区 。本文链接:新研究提升人工智能决策算法适用性http://www.sushuapos.com/show-2-8454-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
上一篇: 珠海率先建成海上智能装备测试场5G专网
下一篇: 我国首个脑血管病大模型问世