设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

警惕人工智能欺骗性升级

发布时间: 来源: 中国科技网

一篇人工智能(AI)领域的文章引起轩然大波。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这篇文章发表在《模式》杂志上,其总结了先前一些研究,向人们揭示了一个真相:一些AI系统已学会了欺骗人类,即使是经过训练的、“表现”诚实的系统。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它们欺骗的方式包括为人类行为提供不真实的解释,或向人类用户隐瞒真相并误导他们。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这让人很惊恐。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因为它突显了人类对AI的控制有多困难,以及人们自认为尚在掌控中的AI系统工作方式,很可能是不可预测的。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI为什么要这么做?MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI模型为了实现它们的目标,会“不假思索”地找到解决障碍的方法。有时这些变通办法会违背用户的期望,并且让人认为其具有欺骗性。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI系统学会欺骗的一个领域,就是在游戏环境中,特别是当这些游戏涉及采取战略行动时。AI经过训练,必须要实现获胜这一目的。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2022年11月,Meta公司宣布创建Cicero。这是一种能够在《外交》在线版本中击败人类的AI。《外交》是一款流行的军事战略游戏,玩家可以在其中建立谈判联盟,争夺对土地的控制权。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta的研究人员已经根据数据集的“真实”子集对Cicero进行了培训,使其在很大程度上诚实且乐于助人,并且它“绝不会为了成功而故意背刺”盟友。但最新的文章揭示,事实恰恰相反。Cicero会违反协议,彻头彻尾地撒谎,还能进行有预谋的欺骗。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

文章作者很震惊:Cicero被特意训练要诚实行事,但它却未能实现这一目标。这表明AI系统在进行忠诚训练后,仍然可以意外地学会欺骗。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta方面既没有证实也没有否认此次关于Cicero表现出欺骗行为的说法。一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩游戏而建立的。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但这并不是唯一一个AI欺骗人类玩家获胜的游戏。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI经常欺骗人类吗?MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿尔法星是深度思维公司为玩电子游戏《星际争霸Ⅱ》而开发的AI。它非常擅长采取一种欺骗对手的技巧(称为佯攻),这个技巧使它击败了99.8% 的人类玩家。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一个名为Pluribus的AI系统,非常成功地学会了在扑克游戏中“虚张声势”,以至于研究人员决定不发布其代码,因为担心它会破坏在线扑克社区。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了游戏之外,AI欺骗行为还有其他例子。OpenAI的大型语言模型 GPT-4 在一次测试中展示出说谎能力。它试图说服人类为其解决验证码问题。该系统还在一次模拟演习中涉足冒充股票交易员的身份进行内幕交易,尽管从未被明确告知要这样做。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些例子意味着,AI模型有可能在没有任何指示的情况下,以欺骗性的方式行事。这一事实令人担忧。但这也主要源于最先进的机器学习模型的“黑匣子”问题——不可能确切地说出它们如何或为何产生这样的结果,或者它们是否总是会表现出这种行为。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人类该怎么应对?MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究表明,大型语言模型和其他AI系统,似乎通过训练具有了欺骗的能力,包括操纵、阿谀奉承和在安全测试中作弊。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI日益增强的“骗术”会带来严重风险。欺诈、篡改等属于短期风险,人类对AI失去控制,则是长期风险。这需要人类积极主动地拿出解决方案,例如评估AI欺骗风险的监管框架、要求AI交互透明度的法律,以及对检测AI欺骗的进一步研究。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这个问题说来轻松,操作起来非常复杂。科学家不能仅仅因为一个AI在测试环境中具有某些行为或倾向,就将其“抛弃或放生”。毕竟,这些将AI模型拟人化的倾向,已影响了测试方式以及人们的看法。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

剑桥大学AI研究员哈利·劳表示,监管机构和AI公司必须仔细权衡该技术造成危害的可能性,并明确区分一个模型能做什么和不能做什么。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

劳认为,从根本上来说,目前不可能训练出一个在所有情况下都不会骗人的AI。既然研究已经表明AI欺骗是可能的,那么下一步就要尝试弄清楚欺骗行为可能造成的危害、有多大可能发生,以及以何种方式发生。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一篇人工智能(AI)领域的文章引起轩然大波。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这篇文章发表在《模式》杂志上,其总结了先前一些研究,向人们揭示了一个真相:一些AI系统已学会了欺骗人类,即使是经过训练的、“表现”诚实的系统。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它们欺骗的方式包括为人类行为提供不真实的解释,或向人类用户隐瞒真相并误导他们。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这让人很惊恐。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因为它突显了人类对AI的控制有多困难,以及人们自认为尚在掌控中的AI系统工作方式,很可能是不可预测的。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI为什么要这么做?MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI模型为了实现它们的目标,会“不假思索”地找到解决障碍的方法。有时这些变通办法会违背用户的期望,并且让人认为其具有欺骗性。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI系统学会欺骗的一个领域,就是在游戏环境中,特别是当这些游戏涉及采取战略行动时。AI经过训练,必须要实现获胜这一目的。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

2022年11月,Meta公司宣布创建Cicero。这是一种能够在《外交》在线版本中击败人类的AI。《外交》是一款流行的军事战略游戏,玩家可以在其中建立谈判联盟,争夺对土地的控制权。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta的研究人员已经根据数据集的“真实”子集对Cicero进行了培训,使其在很大程度上诚实且乐于助人,并且它“绝不会为了成功而故意背刺”盟友。但最新的文章揭示,事实恰恰相反。Cicero会违反协议,彻头彻尾地撒谎,还能进行有预谋的欺骗。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

文章作者很震惊:Cicero被特意训练要诚实行事,但它却未能实现这一目标。这表明AI系统在进行忠诚训练后,仍然可以意外地学会欺骗。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta方面既没有证实也没有否认此次关于Cicero表现出欺骗行为的说法。一位发言人表示,这纯粹是一个研究项目,该模型只是为了玩游戏而建立的。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但这并不是唯一一个AI欺骗人类玩家获胜的游戏。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI经常欺骗人类吗?MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

阿尔法星是深度思维公司为玩电子游戏《星际争霸Ⅱ》而开发的AI。它非常擅长采取一种欺骗对手的技巧(称为佯攻),这个技巧使它击败了99.8% 的人类玩家。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一个名为Pluribus的AI系统,非常成功地学会了在扑克游戏中“虚张声势”,以至于研究人员决定不发布其代码,因为担心它会破坏在线扑克社区。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除了游戏之外,AI欺骗行为还有其他例子。OpenAI的大型语言模型 GPT-4 在一次测试中展示出说谎能力。它试图说服人类为其解决验证码问题。该系统还在一次模拟演习中涉足冒充股票交易员的身份进行内幕交易,尽管从未被明确告知要这样做。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些例子意味着,AI模型有可能在没有任何指示的情况下,以欺骗性的方式行事。这一事实令人担忧。但这也主要源于最先进的机器学习模型的“黑匣子”问题——不可能确切地说出它们如何或为何产生这样的结果,或者它们是否总是会表现出这种行为。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人类该怎么应对?MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

研究表明,大型语言模型和其他AI系统,似乎通过训练具有了欺骗的能力,包括操纵、阿谀奉承和在安全测试中作弊。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

AI日益增强的“骗术”会带来严重风险。欺诈、篡改等属于短期风险,人类对AI失去控制,则是长期风险。这需要人类积极主动地拿出解决方案,例如评估AI欺骗风险的监管框架、要求AI交互透明度的法律,以及对检测AI欺骗的进一步研究。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这个问题说来轻松,操作起来非常复杂。科学家不能仅仅因为一个AI在测试环境中具有某些行为或倾向,就将其“抛弃或放生”。毕竟,这些将AI模型拟人化的倾向,已影响了测试方式以及人们的看法。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

剑桥大学AI研究员哈利·劳表示,监管机构和AI公司必须仔细权衡该技术造成危害的可能性,并明确区分一个模型能做什么和不能做什么。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

劳认为,从根本上来说,目前不可能训练出一个在所有情况下都不会骗人的AI。既然研究已经表明AI欺骗是可能的,那么下一步就要尝试弄清楚欺骗行为可能造成的危害、有多大可能发生,以及以何种方式发生。MAX速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业的创新浪潮。新质生产力时代到来,政企用云进 未来的足球场,人工智能(AI)当“大脑”?《自然·通讯》19日发表一项来自谷歌深度思维的最新成果,研究团队报告了一个名为“TacticAI”的系统,能在足球比赛中预测角球结果并提供实际且准确的战 据中国科学院武汉植物园消息,我国科研人员在大别山区开展植物多样性科学考察时,发现了天门冬科天门冬属新物种,并将其命名为大别山天门冬。相关研究成果日前发表在国际知名植物分类学期刊《植物 据韩国建国大学研究人员发表在最新一期开放获取期刊《公共科学图书馆·综合》上的一项研究,与狗共度美好时光可减轻压力,同时可增强与放松和注意力相关的脑电波。动物辅助干预措施,如犬类   盲视技术已在猴子身上见效!马斯克脑机接口公司新目标:让盲人重见光明  澎湃新闻记者 吴遇利  Neuralink新技术或将造福数千万名失明人士。  当地时间3月21日,特斯拉CEO埃隆・马斯克在社交平台X(原推特)发文称, 3月21日,人工智能大模型赋能企业科技创新研讨会在广州召开。中国知网在会议期间发布了专利大数据智能应用产品“AI Pat+”。据中国知网相关负责人介绍,中国知网在人工智能大模型领域的深入研发 。

本文链接:警惕人工智能欺骗性升级http://www.sushuapos.com/show-2-6031-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 艾滋病疫苗研发再传好消息——一种中和抗体可几周内发挥作用

下一篇: 灵感源于大自然的光合作用,掺杂空气可让有机半导体更导电

热门资讯

推荐资讯

  • 商务部:大力发展离境退税,增加退税商店

      中新经纬3月27日电 据商务部网站27日消息,3月26日,商务部在深圳召开国际化消费环境建设工作现场会,深入贯彻落实党中央、国务院决策部署,扎实推进国际化消费环境建设试点工

  • 1元一包的干脆面,一年卖了近5亿!

      中新经纬3月27日电 (闫淑鑫)近日,康师傅控股(下称康师傅)发布2025年年报,实现收入790.68亿元(人民币,下同),同比下滑2.0%;实现股东应占溢利45亿元,同比增长20.5%;毛利率同比增

  • 官方:到2030年进一步提高高端检测仪器国产化率

      中新经纬3月27日电 据国家市场监督管理总局网站消息,近日国家市场监管总局发布《关于促进特种设备安全与节能科技创新发展的指导意见》(简称《意见》),其中指出,到2030年,突

  • 中国人寿总裁利明光回应单季度亏损:建议拉长周期看报表

      中新经纬3月26日电 (李自曼)“周期越短,受到波动影响会更大,这是经营过程中经常遇到的一个现象。”26日,中国人寿总裁利明光在中国人寿2025年度业绩发布会上说。  财报显

  • 博鳌对话|陈建宇:人形机器人三至五年开始进家庭,价格低于汽车

      中新经纬3月26日电 (薛宇飞 王玉玲)“人形机器人行业的洗牌与整合将逐步发生,资金充裕的头部企业,可能收购聚焦单点技术、细分单品的中小公司,补充技术与业务短板。”  2

  • 外媒:西方天然气公司成中东局势受益者

      中新经纬3月26日电 据路透社报道,美伊局势让西方天然气供应商及贸易商股价成为市场受益者。投资者预计,供应路线可绕开中东地区的企业,将从高能源价格中获得巨额收益。  

  • 沪指半日跌0.58% 光伏设备板块集体回调

      中新经纬3月26日电 周四早盘,A股三大指数早盘冲高回落。截至午间收盘,上证指数跌0.58%,报3909.16点;深证成指跌0.38%,报13748.30点;创业板指跌0.07%,报3314.64点。  沪深两市

  • 财政部就2026年中央预算公开答记者问

      中新经纬3月26日电 据财政部网站消息,3月26日,2026年中央部门预算集中向社会公开。就此,财政部有关负责人回答了记者的提问。  一、请介绍一下近年来中央预算公开进展情

  • 美股三大指数收涨!ARM涨超16%,国际油价跌超2%

      中新经纬3月26日电 国际油价回落,美国股市出现回暖。当地时间25日,美股三大指数集体收涨,道指涨0.66%,纳指涨0.77%,标普500指数涨0.54%。  美国大型科技股多数上涨,亚马逊涨

  • 中国航空工业集团原董事长谭瑞松一审被判死缓

      中新经纬3月25日电 “大连市中级人民法院”微信号消息,2026年3月25日,辽宁省大连市中级人民法院一审公开宣判中国航空工业集团有限公司原党组书记、董事长谭瑞松贪污、受

  • 港股三大指数涨超2%,凯乐士科技上市首日涨84.27%

      中新经纬3月24日电 24日,港股三大指数高开,午后震荡上行。截至收盘,恒生指数涨2.79%报25063.71点,恒生科技指数涨2.51%报4830.89点,恒生国企指数涨2.31%报8499.53点。  Win

  • 老铺黄金2025年线下门店收入增长超2倍

      中新经纬3月24日电 23日盘后,老铺黄金在港交所发布截至2025年12月31日止年度的年度业绩公告。  公告显示,报告期间,集团销售业绩约为人民币313.75亿元,较2024年销售业绩增

  • 日榜
  • 周榜
  • 月榜