压缩算法为大语言模型“瘦身”

发布时间: 2024-11-22 10:12:00 来源：中国科技网

观看：240

据美国科学促进会旗下网站11月19日报道，美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA，能精简大型语言模型（LLM）的海量数据，为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本，还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称，当人们使用ChatGPT时，请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大，通常还很慢。如果用户想要使用消费级图形处理单元运行LLM，就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简，可在手机或笔记本电脑等设备上存储和访问，同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法，但其独特之处在于兼具“低精度”和“低排序”两种特性。其中，“低精度”减少了比特数，加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示，使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外，用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调，这使其能根据特定需求调整模型来增强隐私，而无需与第三方共享敏感数据。

不过团队也提醒道，在智能手机或笔记本电脑上运行LLM，可能会占用设备内存。

据美国科学促进会旗下网站11月19日报道，美国普林斯顿大学和斯坦福大学团队开发出一种新压缩算法CALDERA，能精简大型语言模型（LLM）的海量数据，为LLM“瘦身”。这项算法不仅有助保护数据隐私、节约能源、降低成本，还能推动LLM在手机和笔记本电脑上高效使用。

团队举例称，当人们使用ChatGPT时，请求会被发送到OpenAI公司的后端服务器进行处理。这一过程不仅成本高昂、能耗巨大，通常还很慢。如果用户想要使用消费级图形处理单元运行LLM，就需要对这些LLM进行压缩。

CALDERA算法通过减少LLM冗余并降低信息层的精度来发挥作用。“瘦身”后的LLM更加精简，可在手机或笔记本电脑等设备上存储和访问，同时提供了与未压缩版本几乎一样准确而微妙的性能。

虽然CALDERA并非首个压缩LLM的算法，但其独特之处在于兼具“低精度”和“低排序”两种特性。其中，“低精度”减少了比特数，加快了数据存储和处理速度。而“低排序”则降低了LLM数据中的冗余。

团队表示，使用CALDERA压缩的LLM可能适用于那些对精度要求不是最高的场景。此外，用户可在智能手机或笔记本电脑等设备上对压缩后的LLM进行微调，这使其能根据特定需求调整模型来增强隐私，而无需与第三方共享敏感数据。

不过团队也提醒道，在智能手机或笔记本电脑上运行LLM，可能会占用设备内存。

美国太平洋西北国家实验室的科学家设计了一种复合装饰材料，可以储存更多二氧化碳，提供了一种既符合建筑规范，又比标准复合饰面板便宜的“负碳”选择。研究人员于18日在美国化学会春季会议上公布近日，我国“主要作物丰产增效科技创新工程”重点专项“优质双季超级稻丰产增效技术研发与集成示范”项目，在湖南岳阳宣布启动。据了解，该项目主要聚焦优质双季超级稻丰产增效技术研发，着力探明双　　“AI钢铁侠”黄仁勋，又进化了英伟达　　作者丨倪雨晴　　2024年，英伟达一年一度的GTC大会已然成为AI界春晚，现场座无虚席，全球AI爱好者翘首以待黄仁勋的独家SOLO。　　北京时间3月19日凌晨，GTC终于拉开大幕。英伟达创　　30台发动机助进阶版“鹊桥”升空　　中新社西安3月20日电 (记者张一辰)3月20日8时31分，长征八号遥三运载火箭在中国文昌航天发射场顺利升空，成功将“鹊桥二号”卫星送入预定轨道。作为公共中继星平台，“鹊桥二号” 3月23日消息，据最新爆料，vivo X100s Pro已经获得3C认证，估计会在5月份前后发布。该机可以看做是vivo X100 Pro的小迭代机型，属于半代升级款，与去年X90s类似。新机从此前的天玑9300升级为天玑9300+，处 3月23日消息，vivo X Fold3系列将于3月26日正式发布，成为全球首款骁龙8 Gen3折叠屏电话。现在这款新机外观已经解禁，下面为大家带来图赏。vivo X Fold3提供了薄翼黑和轻羽白两种配色，后壳手感顺滑，触感。

本文链接：压缩算法为大语言模型“瘦身”http://www.sushuapos.com/show-2-9427-0.html

声明：本网站为非营利性网站，本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇： “跨芯片”量子纠缠实现有助建构更强大的量子计算能力

下一篇：世界互联网大会蓝皮书显示我国已建近万家数字化车间和智能工厂

压缩算法为大语言模型“瘦身”

热门资讯

推荐资讯

科技最热文章