设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

“AI界的拼多多”DeepSeek发布新模型

2024-12-28 12:50:55 来源: 澎湃新闻

 UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

12月26日晚间,杭州深度求索人工智能基础技术研究有限公司(以下简称“深度求索”)宣布,全新系列模型DeepSeek-V3首个版本上线并同步开源。UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

深度求索表示,DeepSeek-V3在知识类任务(MMLU, MMLU-Pro, GPQA, SimpleQA)上的水平相比前代 DeepSeek-V2.5显著提升,接近当前表现最好的模型Anthropic公司于10月发布的Claude-3.5-Sonnet-1022。在美国数学竞赛(AIME 2024, MATH)和全国高中数学联赛(CNMO 2024)上,DeepSeek-V3大幅超过了其他所有开源闭源模型。另外,在生成速度上,DeepSeek-V3的生成吐字速度从20TPS(Transactions Per Second每秒完成的事务数量)大幅提高至60TPS,相比V2.5模型实现了3倍的提升,能够带来更加流畅的使用体验。UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

DeepSeek-V3和其他模型的比较。图片来源:Deep Seek微信公众号UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Meta AI研究科学家田渊栋对DeepSeek-V3各个方向上的进展都表示赞赏,称“这是一项了不起的工作”。UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。深度求索表示,“这是一个全新的开始。”。UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

公开信息显示,深度求索成立于2023年7月17日,由知名量化资管巨头幻方量化创立,幻方量化创始人梁文峰在量化投资和高性能计算领域具有深厚的背景和丰富的经验。成立半年后,发布了第一代大模型DeepSeek Coder;2024年5月发布了其第二代开源Mixture-of-Experts(MoE)模型——DeepSeek-V2。DeepSeek V2模型因在中文综合能力评测中的出色表现,且以极低的推理成本引发行业关注,被称为“AI界的拼多多”。DeepSeek-V3模型API服务定价为每百万输入tokens为0.5元(缓存命中)/2元(缓存未命中),每百万输出tokens价格为8元,并享有45天的优惠价格体验期。UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM


UQ1速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:“AI界的拼多多”DeepSeek发布新模型http://www.sushuapos.com/show-11-15661-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 2024年度中国航海学会科学技术奖获奖项目公示

下一篇: 75后福建自然资源厅副厅长陈小辉重回高校,任厦门理工校长

热门资讯

推荐资讯

  • 日榜
  • 周榜
  • 月榜