设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

股价涨超30%后暂停交易,商汤日日新5.0有何亮点?

2024-04-25 17:34:57 来源:

21世纪经济报道记者 董静怡 上海报道aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月23日,商汤科技SenseTime举办技术交流日活动,发布了商汤“日日新SenseNova5.0”。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构(MoE),推理时上下文窗口可以有效到 200K 左右。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据悉,本次更新主要聚集增强了知识、数学、推理及代码能力,对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月24日开盘后,商汤股价大涨,一度涨超36%。上午11点15分,商汤科技公告临时停牌。截至停牌,公司股价为0.80港元/股,涨幅达31.15%,总市值达268亿港元。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

商汤科技回应21世纪经济报道记者称,昨日日日新大模型5.0发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

下午,商汤发布公告表示,董事会注意到最近B类股份的交易价格及交易量发生不寻常波动,B类股份于4月24日上午11时15分起暂停买卖。公司已向联交所申请B类股份于4月25日上午9时正起恢复买卖。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

突破数据瓶颈

如何完成日日新5.0的升级?商汤科技董事长兼CEO徐立在技术交流日点出了关键路径。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”徐立表示。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型的研发在行业当中有一条大家认知的基本法则,业内称之为“Scaling Law 尺度定律”。在尺度定律通常意义下,随着模型的参数变大、数据量变大、训练时长加长,则算法性能会越来越好。因此,要形成通用人工智能模型,对于算力的消耗就变成一种必然要求。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

徐立表示,实际上还有两条隐藏的假设,第一,可预测性,在小尺度上做很多实验,跨越5-7个数量级尺度依然保持对性能的准确预测;第二,保序性,在小尺度上验证了性能优劣,在更大尺度上依然保持。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“尺度定律是资源配置的引导器,可以指导我们在有限的研发资源上找到最优的模型架构和数据配方,让模型能够更高效地完成学习的过程。”徐立表示。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于实验结果,小模型在优化数据的情况下,性能可逼近甚至超越跨数据级的大模型。然而,数据一直是AI持续提升的瓶颈,也是日日新5.0最主要的提升之一。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在知识层面上,日日新5.0采用了超过10TB的Tokens,这确保了高质量数据的完备性,为模型提供了丰富的知识基础。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在推理层面上,日日新5.0通过合成构造思维链数据,这种数据构造方法有助于模型更好地理解和推理行业特定的逻辑和知识。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据介绍,在文科能力方面,“日日新5.0”的创意写作能力、推理能力及总结能力均有提升,相同的中文知识注入后,可获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供辅助。在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力提高,为金融、数据分析等场景落地提供基础。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多模态能力上,支持高清长图的解析和理解以及文生图交互式生成,实现复杂的跨文档知识抽取及总结问答展示,以及具备丰富的多模态交互能力。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

徐立表示,“日日新 5.0 大模型体系综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁。”aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

端云协同

过去的一年,云端的大模型在各个行业都是有了广泛的应用。但智能终端,如手机、PC、汽车,也是通用人工智能应用的一个非常广泛的载体和场景。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

徐立表示,今年是大模型在端侧应用爆发的元年,“端侧能力的应用其实是大模型铺开最核心的关键。”aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了满足移动终端用户对大模型技术的应用需求,商汤此次也推出了1.8B(18亿)参数规模的端侧大模型。据了解,其在中端平台实现18.3字/s的平均生成速度,旗舰平台达到78.3字/s。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一方面,端侧大模型的也是弥补云端的不足。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先是模型性能与成本平衡的挑战。商汤科技联合创始人、首席科学家王晓刚在日前接受21世纪经济报道记者采访时表示,如果几十亿个端侧设备都在不停地调用云端大模型,将需要消耗巨大算力;另一方面涉及数据的传输和延迟,某些特定的场景应用需要快速决策。王晓刚举例,在自动驾驶里,大模型的部署必须发生在端侧。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他进一步表示,不同的应用对于模型的准确率或体验的要求是不一样的,也就意味着,对于模型要求不是非常高的应用可以用端侧模型。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,端云协同解决方案应运而生,在端云结合的架构中,端侧设备(如智能手机、IoT设备等)上部署有较小的、针对特定任务优化的模型。这些模型可以快速响应用户的需求,处理一些不需要大量计算资源的任务。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

云端则拥有更强大的计算资源和更大的模型,可以处理更复杂或需要大量数据的任务。云端模型通常具有更多的参数,能够提供更深层次的学习和推理能力。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

端云结合的MoE架构可以通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过80%,从而显著降低推理成本。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

王晓刚向记者表示,通过智能地选择最合适的模型,端云结合可以提供更快的响应时间和更准确的结果,从而优化用户体验。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

商汤表示,将端侧大模型应用的普及推广作为今年的战略重点。aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤还推出企业级大模型一体机。王晓刚认为,与垂直行业相结合是体现模型“差异化”的一个关键指标,“而模型的应用价值在哪、还能朝哪些方向优化,这些需要行业进行牵引。”aZo速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:股价涨超30%后暂停交易,商汤日日新5.0有何亮点?http://www.sushuapos.com/show-2-5376-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 机器“成人”记丨下一个万亿产业?一图看懂人形机器人产业图谱

下一篇: 名人故事 爱迪生 好奇的儿子和耐心的母亲(名人故事爱迪生)

热门资讯

  • 站在“人工智能+”探索前列

    今年全国两会期间,人工智能成为热点话题,“人工智能+”首次被写入政府工作报告。一头连着数字经济发展大局,一头连着行业变革与创新,“人工智能+”既是

  • 明天氢能荣获国家电网科技进步奖一等奖

    记者3月18日从安徽明天氢能科技股份有限公司(以下简称明天氢能)获悉,国家电网近日向明天氢能及董事长王朝云分别授予科学技术进步奖一等奖,获奖项目为

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 马斯克开源3140亿参数的Grok,大模型争相开源所为何求?

      马斯克开源3140亿参数的Grok,大模型争相开源所为何求?  作者:刘晓洁  特斯拉CEO埃隆・马斯克(Elon Musk)给大模型领域投下一枚重磅炸弹。  北京时间3月18日凌晨,马斯

  • 研究发现神经系统疾病成人类健康主要“杀手”

    据法新社巴黎3月15日报道,15日发布的一项新的重要分析称,影响神经系统的疾病——如中风、偏头痛和痴呆症——已经超过心脏病,成

  • 最小资源消耗的量子态分辨实现

    记者3月20日从中国科学技术大学获悉,该校郭光灿院士团队在量子态分辨研究中取得重要进展:他们在最小资源消耗的量子态分辨问题中首次提出了全局最优

  • 我国首个制氢加氢一体站团体标准发布

    我国制氢加氢一体站建设有了团体标准。记者从中国石化获悉,为推动我国氢能交通产业发展,中国石化联合国内数十家氢能头部企业发布了国内首个《制氢加

  • 光储行业迎来2000V新时代

    3月21日,由安徽省工业和信息化厅指导、中国光伏行业协会主办、阳光电源股份有限公司承办的“PAT2024爱光伏一生一世”先进技术研讨会在合肥举办。光

  • AI、死亡与机器人:“数字生命”背后的生意与争议

    21世纪经济报道记者 冯恋阁 王俊 广州、北京报道2013年播出的科幻电视剧《黑镜》第二季中有这样一个故事——女主角玛莎在男友艾什被车祸

  • 30台发动机助进阶版“鹊桥”升空

      30台发动机助进阶版“鹊桥”升空  中新社西安3月20日电 (记者 张一辰)3月20日8时31分,长征八号遥三运载火箭在中国文昌航天发射场顺利升空,成功将“鹊桥二号”卫星送入

  • 电子导盲犬可能要来了!相关研究在我国取得新突破

    “啪嗒啪嗒......”一只机器狗在街上迈着规律的步伐,拉着牵引绳的盲人,在它的带领下越过沿路障碍,平稳地行走着,电子导盲犬能否取代传统导盲犬,解决视障

  • “捕风捉光”,气象服务助力新能源发电

    今年3月23日是第64个世界气象日,主题是“气候行动最前线”。面对愈加频繁的极端天气和全球变暖等气候危机,减缓气候变化已刻不容缓。发展新能源是应

推荐资讯

  • 日榜
  • 周榜
  • 月榜