设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

股价涨超30%后暂停交易,商汤日日新5.0有何亮点?

2024-04-25 17:34:57 来源:

21世纪经济报道记者 董静怡 上海报道E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月23日,商汤科技SenseTime举办技术交流日活动,发布了商汤“日日新SenseNova5.0”。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

自去年4月首次发布,商汤“日日新SenseNova”大模型体系已正式推出五个大版本迭代。基于超过10TB tokens训练、覆盖大量合成数据,“日日新SenseNova 5.0”(以下简称:日日新5.0)采用混合专家架构(MoE),推理时上下文窗口可以有效到 200K 左右。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据悉,本次更新主要聚集增强了知识、数学、推理及代码能力,对标 GPT-4 Turbo,主流客观评测上达到或超越 GPT-4 Turbo。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

4月24日开盘后,商汤股价大涨,一度涨超36%。上午11点15分,商汤科技公告临时停牌。截至停牌,公司股价为0.80港元/股,涨幅达31.15%,总市值达268亿港元。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

商汤科技回应21世纪经济报道记者称,昨日日日新大模型5.0发布会广受好评,受到市场极大关注;依照上市规则及港交所建议,公司将进一步刊发相关公告。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

下午,商汤发布公告表示,董事会注意到最近B类股份的交易价格及交易量发生不寻常波动,B类股份于4月24日上午11时15分起暂停买卖。公司已向联交所申请B类股份于4月25日上午9时正起恢复买卖。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

突破数据瓶颈

如何完成日日新5.0的升级?商汤科技董事长兼CEO徐立在技术交流日点出了关键路径。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“商汤在尺度定律的指导下,会持续探索大模型能力的KRE三层架构(知识-推理-执行),不断突破大模型能力边界。”徐立表示。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

大模型的研发在行业当中有一条大家认知的基本法则,业内称之为“Scaling Law 尺度定律”。在尺度定律通常意义下,随着模型的参数变大、数据量变大、训练时长加长,则算法性能会越来越好。因此,要形成通用人工智能模型,对于算力的消耗就变成一种必然要求。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

徐立表示,实际上还有两条隐藏的假设,第一,可预测性,在小尺度上做很多实验,跨越5-7个数量级尺度依然保持对性能的准确预测;第二,保序性,在小尺度上验证了性能优劣,在更大尺度上依然保持。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

“尺度定律是资源配置的引导器,可以指导我们在有限的研发资源上找到最优的模型架构和数据配方,让模型能够更高效地完成学习的过程。”徐立表示。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于实验结果,小模型在优化数据的情况下,性能可逼近甚至超越跨数据级的大模型。然而,数据一直是AI持续提升的瓶颈,也是日日新5.0最主要的提升之一。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在知识层面上,日日新5.0采用了超过10TB的Tokens,这确保了高质量数据的完备性,为模型提供了丰富的知识基础。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在推理层面上,日日新5.0通过合成构造思维链数据,这种数据构造方法有助于模型更好地理解和推理行业特定的逻辑和知识。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据介绍,在文科能力方面,“日日新5.0”的创意写作能力、推理能力及总结能力均有提升,相同的中文知识注入后,可获得更好的理解总结及问答,为教育、内容产业等垂直应用场景提供辅助。在理科能力方面,“日日新5.0”数理能力、代码能力及推理能力提高,为金融、数据分析等场景落地提供基础。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

多模态能力上,支持高清长图的解析和理解以及文生图交互式生成,实现复杂的跨文档知识抽取及总结问答展示,以及具备丰富的多模态交互能力。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

徐立表示,“日日新 5.0 大模型体系综合能力全面对标GPT-4 Turbo,技术领跑加速生成式AI向产业落地的全面跃迁。”E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

端云协同

过去的一年,云端的大模型在各个行业都是有了广泛的应用。但智能终端,如手机、PC、汽车,也是通用人工智能应用的一个非常广泛的载体和场景。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

徐立表示,今年是大模型在端侧应用爆发的元年,“端侧能力的应用其实是大模型铺开最核心的关键。”E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了满足移动终端用户对大模型技术的应用需求,商汤此次也推出了1.8B(18亿)参数规模的端侧大模型。据了解,其在中端平台实现18.3字/s的平均生成速度,旗舰平台达到78.3字/s。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

另一方面,端侧大模型的也是弥补云端的不足。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

首先是模型性能与成本平衡的挑战。商汤科技联合创始人、首席科学家王晓刚在日前接受21世纪经济报道记者采访时表示,如果几十亿个端侧设备都在不停地调用云端大模型,将需要消耗巨大算力;另一方面涉及数据的传输和延迟,某些特定的场景应用需要快速决策。王晓刚举例,在自动驾驶里,大模型的部署必须发生在端侧。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他进一步表示,不同的应用对于模型的准确率或体验的要求是不一样的,也就意味着,对于模型要求不是非常高的应用可以用端侧模型。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

因此,端云协同解决方案应运而生,在端云结合的架构中,端侧设备(如智能手机、IoT设备等)上部署有较小的、针对特定任务优化的模型。这些模型可以快速响应用户的需求,处理一些不需要大量计算资源的任务。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

云端则拥有更强大的计算资源和更大的模型,可以处理更复杂或需要大量数据的任务。云端模型通常具有更多的参数,能够提供更深层次的学习和推理能力。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

端云结合的MoE架构可以通过智能化判断协同发挥端云各自优势,需要联网搜索或处理复杂场景时分流至云端处理,部分场景端侧处理占比超过80%,从而显著降低推理成本。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

王晓刚向记者表示,通过智能地选择最合适的模型,端云结合可以提供更快的响应时间和更准确的结果,从而优化用户体验。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

商汤表示,将端侧大模型应用的普及推广作为今年的战略重点。E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此外,对于金融、代码、医疗、政务等重点行业边缘侧日益增长的AI应用需求,商汤还推出企业级大模型一体机。王晓刚认为,与垂直行业相结合是体现模型“差异化”的一个关键指标,“而模型的应用价值在哪、还能朝哪些方向优化,这些需要行业进行牵引。”E32速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:股价涨超30%后暂停交易,商汤日日新5.0有何亮点?http://www.sushuapos.com/show-2-5376-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 机器“成人”记丨下一个万亿产业?一图看懂人形机器人产业图谱

下一篇: 名人故事 爱迪生 好奇的儿子和耐心的母亲(名人故事爱迪生)

热门资讯

  • 云南首批621座变电站实现人工智能巡检

    “远方巡视启动!”南方电网云南保山220千伏大寨变电站日前启动首次全套智能巡视,109个摄像头快速旋转,10套在线监测系统开始收集数据,变电站的无人机机

  • 凌晨重磅!英伟达官宣最强AI芯片

    北京时间凌晨4点至6点,英伟达联合创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》,正式拉开了2024年英伟达GTC大会的序幕。黄仁勋宣布,正

  • 与狗互动有助放松和提高注意力

    据韩国建国大学研究人员发表在最新一期开放获取期刊《公共科学图书馆·综合》上的一项研究,与狗共度美好时光可减轻压力,同时可增强与放松和注

  • Kimi概念股风起:月之暗面的资本征途与技术突破

    21世纪经济报道记者雷晨 北京报道随着人工智能技术的飞速发展,Kimi概念股成为资本市场的新宠。3月21日,受Kimi智能助手技术突破的催化,相关概

  • 培生2023年财报业绩超出预期,持续加码数字产品

    21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基

  • 植物避盐性的关键基因被发现

    记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱

  • 我国成功发射云海二号02组卫星

      我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面

  • 首发天玑9300+联发科最强芯片!vivo X100s Pro入网

    3月23日消息,据最新爆料,vivo X100s Pro已经获得3C认证,估计 会在5月份前后发布。该机可以看做是vivo X100 Pro的小迭代机型,属于半代升级款,与去年X90s类似

  • Kimi掀起国产大模型长文本竞赛

    作为月之暗面的创始人,杨植麟常把他的AGI梦想形容为“登月计划”,长文本就是这个伟大计划的第一步。但现在,随着Kimi的爆火出圈,赛道瞬间变得

  • 尚德机构2023年净收入21.6亿元 详细披露老年教育进展

    21世纪经济报道记者王峰北京报道 近日,成人职业在线教育企业尚德机构(NYSE:STG)公布了其2023年第四季度及全年未经审计的财务报告。2023年

  • 人工智能大模型赋能企业科技创新研讨会召开

    3月21日,人工智能大模型赋能企业科技创新研讨会在广州召开。中国知网在会议期间发布了专利大数据智能应用产品“AI Pat+”。据中国知网相关负责人介

  • 吸烟会增加腹部脂肪

    科学杂志《成瘾》3月21日发表的一项新研究显示,刚开始吸烟和终生吸烟都可能增加腹部脂肪,特别是内脏脂肪。内脏脂肪与心脏病、糖尿病、中风和痴呆症

推荐资讯

  • 日榜
  • 周榜
  • 月榜