21世纪经济报道记者雷晨 北京报道
今年下半年以来,大模型经历了残酷的淘汰赛,少数用户活跃度高的大模型脱颖而出,进入决赛圈。与此同时,各界对于这些模型的性能表现、发展潜力等方面的关注与日俱增。
近期,北京智源人工智能研究院(简称:智源研究院)发布并解读了国内外100余个大模型的综合及专项评测结果,涵盖语言、视觉语言、文生图、文生视频、语音语言等多个领域。
围绕大模型发展趋势、行业现状及相关热点问题,智源研究院副院长兼总工程师林咏华与21世纪经济报道等媒体进行了一场深度对话,从专业视角对大模型的发展趋势、行业现状以及相关热点问题进行剖析。
互联网大厂优势明显,模型发展仍具潜力
林咏华指出,互联网大厂在大模型领域具有显著优势。在语言模型方面,凭借强大的流量优势,大厂能获取更多用户反馈,推动数据飞轮,在主观评测中表现良好。例如字节、快手等公司,在文生图、文生视频领域,因自身短视频平台积累的高质量数据而领先于非互联网厂商。
针对前OpenAI联合创始人、SSI创始人Ilya提出的预训练停滞观点,林咏华予以反驳。她表示,当前互联网存在数据孤岛现象,大量数据未被充分利用,中文数据在全球占比下降,但使用中文上网人数未变。同时,海量视频数据也有待挖掘,以促进模型对世界的认知学习,大模型发展仍有巨大潜力。
模型发展态势分化,多模态潜力凸显
智源评测结果显示,2024年下半年大模型发展呈现新趋势:多模态模型发展迅速,新厂商与新模型不断涌现,在K12学科测试中,融合语言和视觉的多模态模型表现出色,其理解和推理能力更强。语言模型发展则相对放缓,开源的第一梯队模型已达到较高水平,继续提升需更多创新,模型尺寸出现两极分化,除大型稠密模型外,7B或以下小模型下载量也较高。
林咏华认为,多模态模型需求旺盛,但基础能力仍有提升空间,预计2025年将有更多新模型出现。对于资金不强但创新能力足的团队,可在多模态模型的拼接、预处理、后处理、学习方式等方面进行创新。
AI应用趋势明确,算力需求将提升
林咏华还对AI应用趋势进行了展望。她表示,2024年语言模型基础能力提升,推动了复杂应用发展,2025年基于语言模型的Agent将成为热点,用于构建更复杂的AI应用和系统。文生图、文生视频应用也将在2025年迎来发展,VLM多模态模型在企业的落地场景广泛,未来需提升基础能力以形成新应用。
随着模型发展,对算力需求也将变化。林咏华提到,端侧模型正在发力,未来端云结合将成趋势,小模型和大模型将分别承担不同工作,以平衡资源消耗与效率提升。
开源生态持续发展,国内外差距仍存
在模型开源生态方面,除了坚定开源的机构外,新的开源贡献者不断出现。林咏华同时指出,中国在大模型技术领域与国际先进水平相比,在数据和AI系统方面存在差距,包括各类数据资源及算力。未来,国内需加强数据建设,提升算力水平,以推动大模型技术的进一步发展。
3月18日,记者从山西省人民政府获悉,“山西煤炭工业互联网智算平台”日前在山西联通大数据中心建设完成。该平台由中国联通与山西晋云互联科技有限公司共同打造,是山西省目前唯一的垂直行业类智 人体免疫系统中的小过滤器淋巴结有了新妙用。近日,浙江大学药学院、金华研究院教授顾臻团队联合多位科研人员,在国际上首次提出利用冷冻干燥的淋巴结组织提升抗肿瘤药物疗效的方法。相关论文发 科技日报从哈尔滨工业大学获悉,北京时间2024年3月20日8时31分28秒,“天都一号”“天都二号”通导技术试验星伴随探月工程四期鹊桥二号中继星任务搭乘长征八号遥三运载火箭从文昌航天发射场发射 根据《天体物理学杂志》的最新报道,一个国际天文学家团队利用欧洲空间局的盖亚(Gaia)太空望远镜收集的数据,创建了迄今为止最庞大的三维宇宙地图。该地图涵盖了大约130万个活跃类星体的精确空间 我国制氢加氢一体站建设有了团体标准。记者从中国石化获悉,为推动我国氢能交通产业发展,中国石化联合国内数十家氢能头部企业发布了国内首个《制氢加氢一体站技术指南》团体标准。该标准的制定 记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)联合研发出全流程智慧育种平台,实现了育种数 。本文链接:智源研究院林咏华:多模态模型需求旺盛,但基础能力仍有提升空间http://www.sushuapos.com/show-2-9858-0.html
声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。