设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

京东大模型开发计算研究登《Nature》子刊,支持企业大模型蒸馏与开发应用

发布时间: 来源:

  5月15日,京东探索研究院论文《Omniforce:以人为中心的、赋能大模型的、云边协同的自动机器学习系统》发表于《Nature》旗下期刊《npj Artificial Intelligence》,该项研究提出了一种在开放环境场景中训练、更新大模型,并与小模型协同部署的系统与方法,成为国内首个系统性解决开放环境下大模型开发效率难题并获国际顶刊认证的研究成果。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  该技术通过模型蒸馏、数据治理、训练优化与云边协同四大创新,将大模型推理效率平均提升30%,训练成本降低70%,为大模型规模化落地提供了可复用的技术范式。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  京东大模型开发计算技术,推理平均提效30%C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  企业将大模型应用付诸实践,面临着诸多卡点,一方面进入大模型应用门槛高,另一方面模型训练与推理效率低。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  京东大模型开发计算技术,能支持企业的模型开发训练及生产,让庞大、重型的AI模型“瘦身”成精悍的小模型,精华依旧,效率大增,瘦身不降智。既能节省算力资源,加速推理,还能适应多平台,广泛部署到更多平台上。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  论文中提出了四个创新方法:C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ・模型蒸馏,采用动态分层蒸馏技术,特别是在预训练阶段进行蒸馏,调整仅0.5%的参数实现低资源场景下的高效训练,减少大型模型的部署成本。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ・数据治理,提出跨领域数据动态采样算法,自动混合不同领域数据,并引入隐私保护和主动学习技术,提升大模型泛化能力。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ・训练优化,使用贝叶斯优化(BO)框架进行超参数优化和架构搜索,尤其是擅长处理离散空间,MPMD场景下资源利用率提升40%。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  ・云边协同,支持在云端进行模型搜索和训练,边缘设备负责部署和推理,并利用两阶段压缩策略以适应资源限制,提升云边协作的高效性。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  值得一提的是,该平台还可支持京东大模型、Llama、DeepSeek等多个模型的蒸馏、推理。在模型蒸馏层面,效果较同量级模型有明显提升,以京东大模型为例,蒸馏后的大模型Livebench提升14分。大量的实验结果也证明有效性和效率,推理平均提效30%,训练成本平均降低70%。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  JoyBuild大模型开发计算平台,让模型训练与应用更普惠C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  这套京东沉淀下来的大模型开发计算的技术,支撑了JoyBuild大模型开发计算平台,广泛服务行业用户。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  JoyBuild能够为客户的大模型开发和行业应用开发,提供定制化解决方案。JoyBuild支持各类模型的调优开发,内置20余种开源模型和丰富的数据集,并提供100余种算法和工具链,帮助企业根据自身业务特征,将通用模型迅速转化为专业模型,一站式应用大模型。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  现在,不到一周时间,企业即可完成从数据准备、模型训练到模型部署的全流程;之前需要10余人的科学家团队工作,现在只需要1-2个算法人员;通过平台模型加速工具优化,节约90%的推理成本。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  京东丰富的业务场景,还为平台上的基础大模型提供具体的行业应用场景,加速基于大模型的商业化落地。在行业知识库之外,JoyBuild沉淀了京东自己的零售、物流、健康、金融等行业Know-How,可应用于供应链优化、智能客服、营销内容生成等各类场景,加速模型普惠。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  京东给出的大模型解法并不是“黑箱”,而是一条解决大模型训练效率及应用问题的通用路径,是真正的“授之以渔”,对学术界、产业界均有广泛参考价值。未来,京东将进一步提升大模型开发与计算效率,让中小型和大型企业都能低成本、高效构建专属AI应用,助推AI规模化应用落地。C2M速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  中新经纬1月12日电 深圳市人力资源和社会保障局官方微信11日回应“深圳一公司男高管违法开除男员工”称,涉事公司经综合考虑该管理人员处理纠纷时存在不当言论及其他因素,于2023年2月对其进行降职处理,并于2023年3月   中新经纬1月11日电 11日,“中国充电联盟”微信号发布2023年全国电动汽车充换电基础设施运行情况。  公共充电基础设施运行情况  2023年12月比11月公共充电桩增加10.0万台,12月同比增长51.7%。截至2023年12月,联   春节档蝶变:从7亿到80亿,从影院冷清到票房飞驰  在刚刚结束的春节档,电影市场再度创造历史。据灯塔研究院最新发布的《龙腾虎跃,势如破竹――2024年春节档电影市场洞察报告》, 2024年春节档(2月10日-2月17日),全国电 中国经济导报 中国发展网讯 2月20日,龙年春节热闹欢乐的氛围还未散去,甘肃成县就以开局就是决战的干劲、起步就是冲刺的拼劲的崭新面貌召开2024年工作务虚会,聚焦县域经济高质量发展,围绕“2023年怎么看,2   西安青岛居民3月6日起可办理往来港澳“个人旅游签注”  中新网2月23日电 据中华人民共和国出入境管理局网站消息,近日,国务院批准增加陕西省西安市、山东省青岛市为内地赴港澳“个人游”城市。中华人民共和国出入   京津冀以就业服务协同激发区域就业新活力  中新网北京2月22日电 (记者 杜燕)在京津冀协同发展战略实施十周年之际,京津冀三地人社部门22日在北京城市副中心三大建筑之一――北京城市图书馆联合举办“京津冀人社 。

本文链接:京东大模型开发计算研究登《Nature》子刊,支持企业大模型蒸馏与开发应用http://www.sushuapos.com/show-5-56014-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 一季度黄金全产业链观察报告:避险属性主导黄金价格变动

下一篇: 招商银行原副行长丁伟被提起公诉

热门资讯

  • 机票扩大免费退改范围:航司越“卷”消费者越得利

      机票扩大免费退改范围:航司越“卷”消费者越得利    然玉  1月10日起,南航、东航新版机票退改规则生效。根据公告,南航、东航扩大了客票免费退改范围,放宽了因病退改规

  • 万达集团所持近5亿股权被冻结,1月刚被执行1.86亿

      中新经纬2月19日电 近日,大连万达集团股份有限公司(下称万达集团)新增一则股权冻结信息,其所持近5亿股权被冻结。  国家企业信用信息公示系统网站显示,万达集团被冻结的

  • 花式玩法点亮中国春节旅游市场

      (经济观察)花式玩法点亮中国春节旅游市场  中新社北京2月18日电 题:花式玩法点亮中国春节旅游市场  中新社记者 刘文文  餐厅爆满、景区门票售罄、热门酒店“一房

  • 腾讯、小米都在发,有人领了888元,还有人领了66个!你呢?

      中新经纬2月18日电(李晓萱)打扰一下,龙年开工第一天,你领到老板发的红包了吗?  微信推出面对面红包  据微信官方18日消息称,微信推出了“面对面红包”。具体内容如下: 

  • 社评:布林肯的“餐桌菜单论”说明了什么

    美国国务卿布林肯近日在参加慕安会时说的一句话,可以被解读的空间很大,也值得深入解读一下。他在回答主持人关于“美中紧张局势正在导致更大的分裂”提问

  • 农工党中央召开两会情况通报会

    农工党中央召开两会情况通报会农工党中央拟向全国政协十四届二次会议提交34件中央提案、26件界别小组提案中国改革报、中国发展网记者田新元2月20日,在全国

  • 兰州西固:文旅消费态势强势复苏 文旅市场平稳有序

    中国经济导报 中国发展网讯 2024年春节期间,兰州市西固区各大旅游景区、乡村旅游点游人如织,气氛浓郁。全区共接待游客113.78万人次,同比增长10.52%。主要旅游

  • 新一轮雨雪冰冻天气来袭 湖南积极备战保民生

    新华社记者周楠、余春生、谢奔“路上快要结冰了,开车要注意安全。”2月21日中午,在省道S306茶垭段,寒风瑟瑟,湖南省桑植县竹叶坪乡政府工作人员李雅敏正和同事

  • 巴安水务转让资产遭一董事反对 公司称“执行”与本次交易无关

      巴安水务转让资产遭一董事反对 公司称“执行”与本次交易无关  2月22日晚,巴安水务(300262.SZ,股价2.17元,市值14.53亿元)公告称,为改善公司经营和财务状况,缓解公司资金需

  • 2023年市场监管部门检查涉企收费单位7.9万家

      2023年市场监管部门检查涉企收费单位7.9万家  本报讯 记者万静 近日国家市场监督管理总局对外披露数据显示,2023年我国各级市场监管部门共检查涉企收费单位7.9万家,罚没

  • 福建今年首个核电机组工程开工

      福建今年首个核电机组工程开工  中新社漳州2月22日电 (记者 张金川)福建漳州核电3号机组22日开工建设,这是福建今年首台开工建设的核电机组,标志着漳州核电二期工程建设

  • 多家钛白粉企业再度宣布涨价

      多家钛白粉企业再度宣布涨价  2月22日,钛白粉企业金浦钛业发布公告宣布涨价,金浦钛业表示,自2月22日起,公司锐钛型钛白粉销售价格上调800元/吨,对国际各类客户上调110美元/

推荐资讯

  • 第14届中美旅游高层对话将于5月在西安举行

      据外交部网站消息,2024年4月26日,中共中央政治局委员、外交部长王毅在北京同美国国务卿布林肯举行会谈。双方将采取措施扩大两国人文交流,欢迎对方国家留学生,办好5月在中国

  • 同程旅行联合京东解读“五一”出游数据:酒店摄像头探测器销量增长200%

    多元化、个性化的旅行方式,成为中国游客“五一”假期出游的新追求。不想看人海,又要玩得痛快,4月29日,同程旅行联合京东3C数码共同发布《“五一”出游风向标》,解读今年“五一”

  • 韩国一季度接待外国游客达340.3万人次

      4月29日,韩国文化体育观光部和韩国观光公社发布数据。数据显示,韩国今年第一季度接待外国游客340.3万人次,恢复到2019年同期的88.6%,这是自疫情爆发以来单季最高纪录。特别

  • 北京市文明旅游主题宣传活动启动

    4月29日,“文明旅游 美丽中国”全国首发站——北京在行动文明旅游主题宣传活动举办,现场同步启动了“遇见你,成为最美的风景”北京市文明

  • 石基信息2023年营收27.49亿元,同比增长5.93%

    4月30日,石基信息发布2023年全年业绩报告。从营收和利润方面看,公司本报告期实现营业总收入27.49亿元,同比增长5.93%,净亏损1.05亿元,亏损同比减少86.57%。从资产方面看,公司报告

  • “五一”假期到北京西山八大处 喝闽东好茶

    4月30日至5月5日,以“喝好茶 到闽东”“到西山八大处 喝闽东好茶”为主题的第二十三届八大处中国园林茶文化节暨宁德(柘荣高山白茶、寿宁乌茶)文化周

  • 文旅部:2024年“五一”假期国内旅游出游2.95亿人次

      2024年“五一”假期,全国文化和旅游市场总体平稳有序。文化和旅游部6日发布数据显示,据文化和旅游部数据中心测算,全国国内旅游出游合计2.95亿人次,同比增长7.6%,按可比口径

  • 马尔克斯的魔幻现实主义95%是现实

    遗作《我们八月见》的出版,让已经离开十年的加西亚·马尔克斯重回公众的视线。因病魔缠身,加西亚·马尔克斯计划中的自传《活着为了讲述

  • 吉林桦甸第二座五星酒店即将建成投用,总投资1.8亿元

    据江城日报消息,日前,地处吉林省桦甸市桦甸大街繁华路段的华宇国际酒店项目已完成主体封闭,全面进入内部装修阶段,预计7月1日正式对外开放营业。这标志着桦甸市继白云国际酒店后

  • 《红楼梦》的神秘茶器

    话说《红楼梦》第四十一回,写贾母带了刘姥姥等众人至栊翠庵来,妙玉为贾母等人奉上茶后,又让宝钗和黛玉到耳房内吃“梯己茶”,宝玉悄悄地随后跟了来。有

  • 桂林:全面实施景区焕新工程

      近日,桂林市召开A级旅游景区服务质量警示教育工作会议,提出聚焦问题难点,全面实施景区焕新工程,推动全市A级旅游景区高质量发展。  会议提出,要认真梳理去年对全市A级旅游

  • 义乌产业园区最大保租房项目拟于明年3月投运,可提供3838套房源

      5月7日消息,作为义乌产业园区配套集中建设体量最大的保障性租赁住房项目,义乌信息光电高新区人才社区正在加快建设中,主体工程处于收尾阶段,室内装修工程即将开始,计划于2025

  • 日榜
  • 周榜
  • 月榜