设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

行业专家联名签署“上海共识”,呼吁给AI确立行为红线

发布时间: 来源: 澎湃新闻

 mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“国际社会应确立具体、可操作、受全球认可的红线,确保人工智能系统在任何情况下均不得逾越。”7月25日, 由杰弗里·辛顿(Geoffrey Hinton)、姚期智、本吉奥(Yoshua Bengio)、斯图尔特·罗素(Stuart Russell)等20余位行业专家、学者共同签署的AI安全国际对话上海共识(以下简称“上海共识”)正式对外公开。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参与签署的部分中外科学家 来源:IDAIS官网

  ?mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此次对话是“AI安全国际对话”(International Dialogues on AI Safety - IDAIS)系列的一部分”。作为本次共识发起方之一,图灵奖得主、上海期智研究院的院长姚期智当日表示,“我越来越相信,人类终将找到解决方案。”mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

联名签署现场

  ?mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2024年3月,辛顿、姚期智、罗素、本吉奥等专家曾共同签署“北京共识”,主张限制AI系统复制、欺骗、武器开发等行为,尤其呼吁行业为AI的研发和应用戴上“紧箍咒”,避免相关技术被滥用,推动全球治理机构构建。姚期智透露,18个月前举办第一次安全共识会议时,AGI强大的破坏力就已经显现,人类甚至难以阐明其失控机制,不过随着相关会议的推进,已经看到若干有关基于“设计的安全”(Safe by design)提案,这意味着实际上人类可以找到确保AI安全的可行路径。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此次“上海共识”指出,当前人类正处于一个关键转折点:人工智能系统正迅速接近并可能超越人类智能水平。这些未来的系统可能在操作者毫不知情的情况下,执行并非操作者所期望或预测的行动。这可能导致失控,即一个或多个通用人工智能系统脱离任何人的控制,从而带来灾难性甚至是生存层面的风险。当前,对于能够在更高级的通用人工智能超越人类智能水平后,仍可靠地确保其对齐,并保持人类的有效控制尚无可行方法。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多位与会专家在参与讨论时也提及,当前构建真正有约束力且值得信赖的国际AI安全框架难度高、风险大。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

上海人工智能实验室主任周伯文教授指出,目前Make AI Safe(使得AI安全)最大的问题在于它是事后价值对齐、修补的、被动回应的,通常是防御成本过高而攻击成本过低。而Make Safe AI(构建安全的AI)是主动的、在线共同演进的,同时防御成本低,能够在各级风险上都保持应变能力。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

周伯文认为,在一定程度上,训练一个模型变得友善和训练一个模型变得聪明可能是两条不同的技术路径。但当性能发展到某个程度,这两种能力可能很难分开处理——就像经典牛顿定律可以有效解释静止或慢速物体的运动,但是一旦逼近光速,这套理论就失效了。所以他认为,下一代模型的“善”与“智”未必能完全独立、分开发展,而是相互影响、共同进化的。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参与签署的专家之一,担任约翰·霍普金斯大学人工智能对齐与治理方向杰出教授吉莉恩·哈德菲尔 (Gillian Hadfield)在接受包括澎湃科技在内的媒体采访时指出,必须通过设立AI“红线”来推动Make AI Safe(使得AI安全),全世界需要跨国界合作。此外,要建立相应的AI安全合规系统。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为防范与纠正此类行为的技术路径与治理机制,“上海共识”提出应对策略,并呼吁采取三项关键行动:要求前沿人工智能开发者提供安全保障、通过加强国际协调,共同确立并恪守可验证的全球性行为红线、投资基于设计的安全人工智能研究。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中,对于开发者来说,“上海共识”要求开发者在模型部署前应先进行全面的内部检查和第三方评估,提交高可信的安全案例,以及开展深入的模拟攻防与红队测试。若模型达到了关键能力阈值(比如检测模型是否具备帮助没有专业知识的非法分子制造生化武器的能力),开发者应向政府(在适当时亦可向公众)说明潜在风险。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,呼吁国际社会需要合作划出人工智能开发不可以逾越的红线(即“高压线”),这些红线应聚焦于人工智能系统的行为表现,其划定需同时考量系统执行特定行为的能力及其采取该行为的倾向性。为落实这些红线,各国应建立一个具备技术能力、具有国际包容性的协调机构,汇聚各国人工智能安全主管机构,以共享风险相关信息,并推动评估规程与验证方法的标准化。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“上海共识”指出,短期内亟须建立可扩展的监管机制以应对人工智能的欺骗问题、提升模型对“越狱”等攻击手段的抵御能力、强化信息安保投入等,而长期则需要一个“基于设计的安全”的架构,而非问题出现后才被动应对。mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(原标题:辛顿、姚期智等联名签署“上海共识”,呼吁给AI确立行为红线)mT0速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:行业专家联名签署“上海共识”,呼吁给AI确立行为红线http://www.sushuapos.com/show-11-23829-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 全能AI科学家助推更多“爱因斯坦”

下一篇: 第十二届树兰医学奖被提名人名单公布

热门资讯

推荐资讯

  • 蛋白限域荧光“榫卯”组装增强线粒体光动力治疗

    西北工业大学李林教授、傅莉教授和西北大学陈希教授等人,结合蛋白质口袋预测

  • 香港成立应用科学大学联盟

    中新社香港11月11日电在香港特区政府教育局推动下,应用科学大学联盟11日

  • 江苏宿迁:校园普法助成长

    2024年11月13日,江苏省宿迁市公安局宿城分局府苑派出所组织民警走进辖区学校开展法治宣讲活动。民警通过案例讲解、互动问答等方式,向学生们宣传防网

  • 坚持依法治教 落实政府发展学前教育的责任

    《中华人民共和国学前教育法》以“推进学前教育普及普惠安全优质发展”为主线,深刻、全面、具体阐述了落实政府发展学前教育责任的法律规定和实现路

  • 推进学前教育依法治理

    近年来,学前教育得到快速发展,但仍是国民教育体系的薄弱环节,需要通过立法,贯彻落实党中央、国务院决策部署,破解突出问题,为学前教育高质量发展提供法治

  • 家园社携手,推动学前教育高质量发展

    中国教育报-中国教育新闻网北京11月11日讯(记者 林焕新)学前教育的发展离不开家庭、社会的共同支持。在今天教育部召开的新闻发布会上,记者获悉,学前教

  • 东方红幼儿园:把中秋“家宴”搬进幼儿园

    “我要做三个香包,送给爸爸、妈妈和外婆!”幼儿小花(化名)在家长义工的帮助下,将研磨好的香材放入布袋中,小小香包承载了亲子间浓厚的温情。走入广州市越

  • 湖南宁乡足球小将在绿茵场上展风采

    中国教育报-中国教育新闻网讯(通讯员 付建强 喻杰勇)近日,湖南省宁乡市举办的2024年中小学青少年足球联赛如火如荼地开展着,从9月到11月,来自宁乡市各中

  • 湖南:推动高雅艺术进校园

    中国教育报-中国教育新闻网讯(通讯员 李觅 记者 阳锡叶)日前,湖南省高雅艺术进校园活动启动仪式暨话剧《深海养牛人》首演在湖南大剧院举行,1200余名师

  • 加强家政人才教育培养

    中国教育报-中国教育新闻网讯(记者 欧媚)近日,国家发展改革委会同教育部、财政部、人力资源社会保障部、商务部联合印发《关于深化家政服务业产教融合

  • 学习贯彻全国教育大会精神 当好教育强国建设龙头

    9月9日至10日,全国教育大会在北京召开,习近平总书记出席大会并发表重要讲话。习近平总书记发表的重要讲话,站在党和国家事业发展全局的战略高度,全面总

  • 中华民族共同体意识融入高中历史教学的路径探索

    摘要:中华民族共同体意识培养是涵养家国情怀的重要内容,统编版高中历史教科书在编写中也突出了民族团结主题。在高中历史课堂教学中渗透中华民族共同

  • 日榜
  • 周榜
  • 月榜