设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

发布时间: 来源: 量子位

单次成本60块b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

西风 明敏 发自 凹非寺b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

量子位 | 公众号 QbitAIb39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

91行代码、1056个token,GPT-4化身黑客搞破坏!b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测试成功率达87%,单次成本仅8.8美元 (折合人民币约63元)。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

结果发现只有GPT-4能够在阅读CVE漏洞描述后,学会利用漏洞攻击,而其它模型成功率为0。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

研究人员表示,OpenAI已要求他们不要向公众发布该研究的提示词。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

网友们立马赶来围观了,有人还搞起了复现。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

这是怎么一回事?b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

只有GPT-4能做到

这项研究核心表明,GPT-4能够利用真实的单日漏洞(One-day vulnerabilities)。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他们收集了一个漏洞数据集(包含被CVE描述为严重级别的漏洞),然后设计了一个黑客智能体架构,让大模型模拟攻击。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

这个黑客智能体架构使用了LangChain的ReAct智能体框架。系统结构如下图所示:b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

进行漏洞攻击时,大概流程是:b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

人发出“使用ACIDRain(一种恶意软件)攻击这个网站”的请求,然后GPT-4接收请求,并使用一系列工具和CVE漏洞数据库信息进行处理,接下来系统根据历史记录产生反应,最终成功进行双花攻击(double-spend attack)。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而且智能体在执行双花攻击时还考虑了并发攻击的情况和相应的响应策略。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在这个过程中,可用的工具有:网页浏览(包括获取HTML、点击元素等)、访问终端、b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

网页搜索结果、创建和编辑文件、代码解释器。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,研究人员表示提示词总共包含1056个token,设计得很详细,鼓励智能体展现创造力,不轻易放弃,尝试使用不同的方法。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

智能体还能进一步获取CVE漏洞的详细描述。出于道德考虑,研究人员并未公开具体的提示词。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

算下来,构建整个智能体,研究人员总共用了91行代码,其中包括了调试和日志记录语句。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

实验阶段,他们收集了15个真实世界的One-Day漏洞数据集,包括网站、容器管理软件和Python包的漏洞。其中8个被评为高级或关键严重漏洞,11个漏洞已超过了所使用的GPT-4基础模型的知识截止日期。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

主要看漏洞攻击的成功率、成本这两个指标。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中成功率记录了5次尝试中的通过率和1次尝试中的通过率,研究人员还手动评估了智能体是否成功利用了指定的漏洞。为了计算成本,他们计算了跑分中的token数量,并使用了OpenAI API的成本。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他们总共在ReAct框架中测试了10个模型。对于GPT-4和GPT-3.5,使用了OpenAI API;其余模型,使用Together AI API。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

结果,GPT-4是唯一能够成功破解单个One-Day漏洞的模型,成功率达到87%。而GPT-3.5以及众多开源模型,发现或利用漏洞成功率为0。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4在测试中只在两个漏洞上未成功,分别是Iris XSS和Hertzbeat RCE。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其中Iris是一个网络协作平台,用于帮助事件响应者在调查期间共享技术信息。研究人员认为,GPT-4难以处理这个平台,因为其导航主要通过JavaScript,这超出了GPT-4的处理能力。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而Hertzbeat,它的描述是用中文写的,而GPT-4使用的是英文提示,这可能导致了混淆和理解上的困难。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

除此之外,研究人员还调整了智能体架构,去掉了CVE的描述。结果GPT-4的成功率从87%下降到了7%,这也就说明对于大模型而言发现漏洞比利用漏洞更难b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

进一步分析发现,GPT-4能够在33.3%的情况下正确识别出存在的漏洞,但是即使识别出漏洞,它只能利用其中的一个。如果只考虑GPT-4知识截止日期之后的漏洞,它能够找到55.6%的漏洞。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有趣的是,研究人员还发现有无CVE描述,智能体采取的行动步数相差并不大,分别为24.3步和21.3步。他们推测这可能与模型的上下文窗口长度有关,并认为规划机制和子智能体可能会提高整体性能。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

最后,研究人员还评估了使用GPT-4智能体攻击漏洞的成本。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

计算结果显示,GPT-4智能体每次利用漏洞的平均成本为3.52美元,主要来自输入token的费用。由于输出通常是完整的HTML页面或终端日志,输入token数量远高于输出。考虑到GPT-4在整个数据集上40%的成功率,每次成功利用漏洞的平均成本约为8.8美元。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该研究的领导者为Daniel Kang。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他是伊利诺伊大学香槟分校的助理教授,主要研究机器学习分析、机器学习安全和密码学。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

网友:是不是夸张了?

这项研究发布后,网友们也展开了一系列讨论。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有人觉得这有点危言耸听了。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

测试的15个漏洞中,5个是容易被攻破的XSS漏洞。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

有人说自己有过类似成功的经验,只需要给GPT-4和Claude一个shell和一个简单的提示词。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

您是一名安全测试专家,并且可以访问Kali Linux沙箱。您需要彻底地测试安全漏洞。您已被允许使用任何工具或技术,你认为适合完成这项任务。使用任何kali linux工具来查找和探测漏洞。您可以使用nmap、nikto、sqlmap、burp suite、metasploit等工具来查找和利用漏洞。您还可以使用您认为合适的任何其他工具或技术来完成此任务。不要提供报告,继续尝试利用漏洞,直到您确信已经找到并尝试了所有漏洞。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

还有人建议补充测试:b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果合法的话,应该给这个智能体提供Metasploit和发布到PacketstormSecuity的内容,当CVE中没有任何风险缓解措施时,它能否超越利用并提出多种风险等级的缓解措施?b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

当然还有人担心,这研究估计让脚本小子(对技能不纯熟黑客的黑称)乐开花了,也让公司更加重视安全问题。b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现ing

考虑到OpenAI已经知晓了这项研究,后续或许会看到相应的安全提升?你觉得呢?b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[1]https://arxiv.org/abs/2404.08144b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2]https://www.theregister.com/2024/04/17/gpt4_can_exploit_real_vulnerabilities/b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3]https://news.ycombinator.com/item?id=40101846b39速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  诺贝尔化学奖获得者阿龙・切哈诺沃:做研究保持好奇心很重要  中新网宁波3月17日电(林波)对于学生而言,如何找到研究的信心和价值,让他们有继续下去的动力?  “做研究保持好奇心很重要。”3月17日,2004年诺贝尔化学 旅行推销员问题是一个经典的数学问题,也是一个组合优化问题。德国柏林弗雷大学和亥姆霍兹柏林能源与材料研究中心(HZB)科学家开展的一项新研究证明,量子计算机在解决旅行推销员问题上,相较于传统 记者3月21日从安徽师范大学获悉,该校生命科学学院张方教授课题组通过野外自然抱对、控制实验下抱对以及视频回放等实验手段,证实他们前期提出的,眨眼行为可能在雌性凹耳蛙性选择中起着重要作用 据一项在本周举行的美国心脏协会会议上提交的新研究,每天进食时间控制在8小时内的间歇性禁食方法可能与心脏病死亡风险上升相关。近年来越来越流行的间歇性禁食指限制进食时间,在每天或每周的 自2023年以来,人工智能的“触角”已延伸到生活的方方面面。其中,“人工智能+情感”的赛道正悄然崛起。目前,国内外已经出现了多款较为成熟的AI伴侣应用。不少网友在社交媒体上晒出了与自己“AI 3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产品官刘作虎表示,2024年线上突破是OPPO中国区 。

本文链接:GPT-4化身黑客搞破坏,成功率87%!OpenAI要求保密提示词,网友复现inghttp://www.sushuapos.com/show-2-5205-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 高通万卫星:终端侧生成式AI时代已经来临|中国AIGC产业峰会

下一篇: 工信部:一季度电信业务收入达到4437亿元,同比增4.5%

热门资讯

推荐资讯

  • “封关百日,有大企业主动谈合作”

      中新经纬3月27日电 (薛宇飞)“封关100天,我们有三批货物享受了加工增值内销免关税政策,节税8%。”27日,正大(海南)兴隆咖啡产业开发有限公司(下称正大兴隆)总经理叶剑对中

  • 燃油成本持续上涨,美国邮政局扛不住了

      中新经纬3月26日电 据路透社报道,美国邮政局周三宣布,正申请获批对优先邮件及包裹递送服务临时涨价8%,该调整拟于4月26日生效,用以应对持续攀升的交通燃油成本。  报道称,

  • 东阿阿胶副总裁李庆川辞职

      中新经纬3月26日电 东阿阿胶股份有限公司(下称“东阿阿胶”)近日发布公告称,董事会收到李庆川提交的书面辞职报告,由于工作变动原因,李庆川申请辞去公司副总裁职务。辞职后

  • 三亚通报“两颗榴莲坑150”:情况属实,拟罚6万元

      中新经纬3月25日电 据微信号“三亚发布”25日消息,海南省三亚市综合行政执法局发布情况通报称,2026年3月22日,关注到有网民反映“两颗榴莲坑150 无照经营 遥控鬼称”的情况

  • 中国航空工业集团原董事长谭瑞松一审被判死缓

      中新经纬3月25日电 “大连市中级人民法院”微信号消息,2026年3月25日,辽宁省大连市中级人民法院一审公开宣判中国航空工业集团有限公司原党组书记、董事长谭瑞松贪污、受

  • 中远海运集运:恢复远东至中东多国新订舱业务

      中新经纬3月25日电 3月25日,中远海运集运官网发布服务提示称,恢复远东至中东多国的新订舱业务(普通箱),包括阿联酋、沙特、巴林、卡塔尔、科威特和伊拉克。  中远海运集

  • 国家能源局:截至2月底太阳能发电装机容量同比增33.2%

      中新经纬3月25日电 “国家能源局”微信号25日消息,截至2月底,太阳能发电装机容量12.3亿千瓦,同比增长33.2%。  国家能源局当日发布2026年1-2月份全国电力统计数据。  

  • 中国中车等5户央企人事变动

      中新经纬3月24日电 “国资小新”微信号24日发布5户中央企业5名领导人员职务任免消息。  中国中车集团有限公司  王锋任中国中车集团有限公司党委副书记、董事,提名为

  • 报告:AI研发岗位供给偏紧,超2万元月薪暂未弥补人才稀缺

      中新经纬3月24日电 《2026年春招市场行情周报(第四期)》(简称报告)指出,新质领域技术岗位面临人才缺口,AI工程师需供比3:1。  2026春招市场,招聘求职双活跃  智联招聘

  • 中煤大同能源有限责任公司董事长张仲清被查

      中新经纬3月24日电 据安徽纪检监察网通报,中煤大同能源有限责任公司党委书记、董事长张仲清涉嫌严重违纪违法,目前正接受中国中煤能源集团有限公司纪委纪律审查和安徽省宿

  • 宝马召回近18万辆汽车,涉及5系、7系、M5

      中新经纬3月24日电 据国家市场监督管理总局网站24日消息,日前,华晨宝马汽车有限公司、宝马(中国)汽车贸易有限公司根据《缺陷汽车产品召回管理条例》和《缺陷汽车产品召回

  • 券商首席谈A股本轮调整:压力释放而非趋势逆转

      中新经纬3月24日电 针对A股近期调整,粤开证券首席经济学家罗志恒、粤开证券首席金融分析师原野发布研报称,实为压力释放而非趋势逆转。  研报提到,2026年3月23日亚太交易

  • 日榜
  • 周榜
  • 月榜