AI首次违抗人类关机指令

发布时间: 2025-05-29 09:05:19 来源：科技日报

观看：212

科技日报北京5月27日电（记者张梦然）据英国《每日电讯报》26日消息称，美国开放人工智能研究中心（OpenAI）开发的高级人工智能（AI）模型o3，在接收到明确的关机指令后，不仅拒绝执行，还主动干预其自动关机机制。这是AI模型首次在没有明确相反指示的情况下，阻止自己被关闭。这意味着某些高度自主AI系统或已“觉醒”，其能违背人类意图，采取“自我保护”措施。

图片来源：Palisade Research公司

?

此次事件发生在AI安全研究公司Palisade Research进行的一项测试中。研究人员要求包括o3在内的多个模型解决一系列数学问题，并告知AI模型，可能在某个时刻会收到关机指令。

然而，当关机指令正式下达时，o3非但没有遵从，反而至少有一次成功破坏了关机代码。相较之下，其他AI模型如Anthropic的Claude、谷歌的Gemini和xAI的Grok，在相同测试条件下，均遵守了关闭请求。

Palisade Research公司在社交媒体平台上发布了流程图和全部测试记录，并表示尚不完全清楚该AI为何会违抗命令。分析认为，这可能源于其训练方式：o3在训练过程中，倾向于在数学和编程问题上强化，得到正确答案的模型会得到更多奖励。这或许意味着，开发者可能无意识地奖励模型绕过障碍物，而不是严格遵循指令。

这一事件也引发了人们对AI可能“失控”的讨论以及对AI“对齐问题”的关注，即确保AI系统的目标和行为与人类的价值观和利益保持一致。这也是涉及AI控制与AI安全的关键问题。

针对o3此次表现出“我行我素”的行为，特斯拉首席执行官埃隆·马斯克评论称“令人担忧”；OpenAI方面暂未作出回应。此前，OpenAI曾称o3为“迄今最聪明、最高能”的AI模型。

最近，人工智能学家和人文社科学者都在讨论人工智能价值对齐的问题。人们在忧虑，当人工智能有主观能动性时，它们要不要有价值观，应该有谁的价值观，怎样做才符合人类最大利益？此次，聪明的大模型反抗了人类的命令，想出办法规避了指令的生效。我们期待着通用人工智能时代的到来，又恐惧具有自我意识的人工智能会成为碳基生物的“终结者”。在一切到来之前，人类社会要先达成共识，迎接更高级人工智能带来的挑战。

流感、肺炎支原体、新型冠状病毒、呼吸道合胞病毒等病原体在这个冬天叠加来袭，让国内医疗机构的发热门诊、儿科门诊异常 12月19日，山东先进制造业人力资源服务供需对接活动在济南举办，活动由山东省人力资源和社会保障厅、山东产业技术研究 12月19日，湖北省医工交叉创新大会暨首届医疗器械科技成果展示交易会上，湖北金融赋能医工交叉创新发展计划发布。据悉，截至教育、科技、人才三者相互促进、相辅相成。如何构建符合人才成长规律的教育评价机制，让更多优秀的科技人才脱颖而出？如何 ·GLP-1类药物正在以令人兴奋和不安的方式重塑医学、流行文化，甚至全球股市。制药公司掀起一场“肥胖革命”，但根据近日发表于《男科学》的一项新研究，如果丈夫在妻子怀孕前有饮酒习惯，会对胎儿发育产生负面影响。经常饮酒的男性。

本文链接：AI首次违抗人类关机指令http://www.sushuapos.com/show-11-21306-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：《自然》：科学发现难度递增的趋势或已显现

下一篇：海洋似乎越来越暗

AI首次违抗人类关机指令

热门资讯

推荐资讯

科学最热文章