设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

ChatGPT参数规模被扒:只有7B

2024-03-17 20:10:03 来源:

ChatGPT 惨遭攻击,参数规模终于被扒出来了——3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

很可能只有 7B(70 亿)。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

消息来自南加州大学最新研究,他们使用一种攻击方法,花费不到 1000 美元就把最新版 gpt-3.5-turbo 模型的机密给挖了出来。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

果然,OpenAI 不 Open,自有别人帮他们 Open。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体来说,南加大团队三位作者破解出了未公布的 gpt-3.5-turbo嵌入向量维度(embedding size)为 4096 或 49。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而几乎所有已知的开源大模型如 Llama 和 Mistral,嵌入向量维度 4096 的时候都是约 7B 参数规模。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此南加大团队指出,可以推测 gpt-3.5-turbo 的参数规模也在 7B 左右,除非是 MoE 架构可能不同。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

数月前,曾有微软 CODEFUSION 论文意外泄露当时 GPT-3.5 模型参数为20B,在后续论文版本中又删除了这一信息。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当时引起了一阵轩然大波,业界很多人分析并非不可能,先训练一个真正的千亿参数大模型,再通过种种手段压缩、蒸馏出小模型,并保留大模型的能力。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

而现在的 7B,不知道是从一开始 20B 的消息就不准确,还是后来又再次压缩了。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但无论是哪一种,都证明 OpenAI 有很恐怖的模型优化能力。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,南加大团队是怎么扒出 ChatGPT 未公开配置的呢?3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

还要说到现代语言模型中普遍存在的 "Softmax 瓶颈"。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当 Transformer 网络处理完输入,会得到一个低维的特征向量,也就是 Embedding。这个特征向量再经过 Softmax 变换,就得到了最后的概率分布输出。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

问题就出在 Softmax 这里,因为矩阵的秩最多只能等于特征向量的维度,所以大模型的输出空间事实上被限制在了一个低维的线性子空间里。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这就像是无论你的衣柜里有多少件衣服,最后能穿出去的搭配,其实是有限的。这个 " 衣柜 " 的大小,就取决于你的 " 特征向量维度 " 有多大。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

南加大团队抓住了这一点,他们发现,只要从 API 调用中获取到足够多的输出样本,就足以拼凑出这个大模型的特征向量维度。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

有了这个特征向量维度,可以进一步推断大模型的参数规模还原出完整的概率输出在 API 悄悄更新时也能发现变化,甚至根据单个输出判断来自哪个大模型3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

更狠的是,推测特征向量维度并不需要太多的样本。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以 OpenAI 的 gpt-3.5-turbo 为例,采集到 4000 多个样本就绰绰有余了,花费还不到 1000 美元。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在论文的最后,团队还探讨了目前的几个应对这种攻击的方法,认为这些方法要么消除了大模型的实用性,要么实施起来成本高昂。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过他们倒也不认为这种攻击不能有效防护是个坏事,3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一方面无法用此方法完整窃取模型参数,破坏性有限。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一方面允许大模型 API 用户自己检测模型何时发生变更,有助于大模型供应商和客户之间建立信任,并促使大模型公司提供更高的透明度。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这是一个 feature,不是一个 bug。3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

论文:3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

https://arxiv.org/abs/2403.095393L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

参考链接:3L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

https://x.com/TheXeophon/status/17686595206270976483L6速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:ChatGPT参数规模被扒:只有7Bhttp://www.sushuapos.com/show-2-3855-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: “刷子”变豪车,宁波海关查获集装箱夹藏劳斯莱斯轿车

下一篇: 上汽飞凡回应传言:进一步深化“轻资产”战略,年中还有重磅车型

热门资讯

  • 未来,政企深度用云需要一朵怎样的“云”?

    随着历史的车轮驶入2024年,大模型、AIGC等话题引发广泛热议,云计算与AI技术展现出了前所未有的深度融合趋势,就如同寒武纪的生物大爆发,激发着各行各业

  • “桃花癫”是种病,得治

    民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精

  • 什么是“时空连续体”?

    英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuu

  • 科学新发现丨有史以来最大的三维宇宙地图发布

    根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地

  • 来看金星土星“亲密一刻”

    3月22日黎明,太阳系中最明亮的行星金星与太阳系中拥有最多卫星的行星土星将在东南方低空近距离相伴,上演“结伴游”。北京星空摄影爱好者王俊峰2023

  • AI+智能家居赋能健康睡眠

    3月21日是第二十五个“世界睡眠日”,中国睡眠研究会联合慕思集团在北京正式发布《2024情绪与健康睡眠白皮书》(以下简称《白皮书》)。《白皮书》指出,

  • 京东与OPPO重磅合作:销售额3年翻倍!

    3月23日消息,京东与OPPO战略合作协议签约仪式举行,双方签订未来三年OPPO在京东全渠道实现销售额同比增长100%的目标。在签约仪式上,OPPO高级副CEO、首席产

  • 尚德机构2023年净收入21.6亿元 详细披露老年教育进展

    21世纪经济报道记者王峰北京报道 近日,成人职业在线教育企业尚德机构(NYSE:STG)公布了其2023年第四季度及全年未经审计的财务报告。2023年

  • 站在“气候行动最前线”,我们该如何行动?

    联合国政府间气候变化专门委员会(IPCC)最新发布的评估报告显示,全球温升预计在2021年至2040年内达到1.5℃。报告指出,自IPCC第五次评估报告发布以来,全

  • 新技术破解结核病“早发现早治疗”难题

    3月24日是第29个世界防治结核病日,我国的宣传主题是“你我共同努力,终结结核流行”。在北京大学社会化媒体研究中心21日举办的“技术升级,加速我国终

  • 甘蓝育种大突破:“一步法”快速创制不育系

    3月24日,记者从中国农业科学院获悉,该院蔬菜花卉研究所甘蓝类蔬菜遗传育种创新团队,开发了快速创制细胞质雄性不育系的新方法——“一步法

  • 诺基亚手机“掉队”带来的启示

    作为功能机时代的霸主,诺基亚手机曾经创造了巨大的辉煌,但也因错失智能手机发展机遇而“掉队”。近期,外媒Visual Capitalist统计了有史以来最畅销的1

推荐资讯

  • 日榜
  • 周榜
  • 月榜