设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品

2024-04-09 17:16:14 来源: 量子位

“技术驱动的多模态交互Native产品将形成新的产品习惯”WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

香港也有大模型公司了。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Weitu AI,一家全力打造多模态Native产品的公司,其创始人王历伟博士在介绍时,特别强调了“多模态Native”这个关键词 。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

就在前不久,Weitu AI推出了自家的150亿参数多模态大模型WeituAI 1.0,在诸多国际权威评测榜单如MMMU[1],MMBench[2],CMMMU[3],SEED-Bench[4]和MM-Vet[5]等上一路高歌猛进。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

虽然参数规模不算大,但不仅力压200亿参数量以下的同量级模型,甚至在一些榜单直接超车LLaVA-NeXT-34B、MM1-30B-Chat等更大模型WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这些评测结果不仅反映模型的性能优势,也反映了其多模态能力的全面性。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

例如,在由俄亥俄州立大学,滑铁卢大学,卡内基梅隆大学和普林斯顿大学等机构联合发布的大规模多学科多模态理解和推理数据集MMMU上,WeituAI 1.0取得了百亿参数模型中的优异成绩,仅次于一系列规模更大的模型,如GPT-4V等[1]。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在由香港科技大学、中科院自动化所和北京大学等机构组织的中文学科多模态数据集CMMMU上,WeituAI 1.0在200亿参数量以下模型中排名第一[3]。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

探索算法创新,瞄准多模态交互Native

为什么首先是百亿参数模型?WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据王历伟博士介绍,因为这个参数规模的模型在打造实际多模态场景产品的时候,有非常灵活的想象空间。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

此次在这些多模态大模型评测基准上展示了基础的多模态理解能力,但是目前上述的评测基准大多以理解能力为主,尚没有完全展示Weitu AI大模型最擅长和最有特点的多模态交互能力WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Weitu AI针对多模态交互做了很多结构优化,不仅让WeituAI 1.0模型在传统的多模态理解任务上保持优势,更让其在多模态交互Native场景大放异彩。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品

事实上,作为深耕多模态(视觉和自然语言结合领域)十多年的资深专家,王历伟博士对当下大模型的局限有着敏锐洞察WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当问到为什么会出现这样的情况,王历伟博士指出,“原因很多,但是有一个非常本质且当前诸多多模态模型尚未完全解决的问题是, 传统的图像文本映射到同一个向量特征空间(embedding)的表达方法对视觉和跨模态建模具有局限性。 ”WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

总结起来就是,多模态大模型技术其实还有很多可以改进的地方,而Weitu AI也在不断探索算法上的创新。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

技术驱动产品,“双轮驱动”成就多模态新机遇

在王历伟博士看来,一款成功的多模态Native产品,离不开技术和产品力的“双轮驱动”,缺一不可。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

和移动互联网时代的产品相比,要打造一款成功的多模态Native产品有何不同?WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

王历伟博士认为,需要同时满足两个因素:第一个是产品力,第二个就是人工智能多模态技术。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

据悉,截止到4月,Weitu AI的多模态图像语言理解等技术被全球化的产品公司调用功能即将超过一亿次,而且这个数字会未来会持续增长。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

但在王历伟博士看来,这还远远不够。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

他认为,Weitu AI的细粒度跨模态理解能力持续给这些全球化的客户平台公司输送提高产品智能交互能力的“燃料”,而且这种细颗粒度理解能力只是Weitu AI多模态着力打造的多项技术优势中的一种。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不仅如此,Weitu AI自己的一款充满想象力的C端产品也在努力打造中。未来 Weitu AI将致力于打造丰富的多模态交互Native产品矩阵,而这些产品矩阵的基础,就是Weitu AI不断进化和发展的多模态交互大模型。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品

站在用户和市场的角度,多模态大有可为

最后,王历伟博士分享了他对创业的感悟:WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Weitu AI的故事,恰恰诠释了技术与产品力的“同理心”。他们在多模态技术的攻坚上不遗余力,更以对用户痛点的洞察,为这项前沿技术找到落地的场景。于是,我们看到的不再是简单的技术堆砌,而是与人的交互习惯深度融合的“多模态新产品”。WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

如果对打造这个新产品感兴趣,欢迎多模态大模型、AIGC、模型训练、推理和部署等方向的技术研发,前端和后端工程师,C端产品经理、产品运营、产品增长等方向的优秀人才投送简历至: job@weitu.aiWtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

商务洽谈,也欢迎邮件联系contact@weitu.aiWtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

评测榜单链接 (其中WeituAI 1.0模型名称 Weitu-VL-1.0)
[1] https://mmmu-benchmark.github.io/WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[2] https://mmbench.opencompass.org.cn/leaderboardWtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[3] https://cmmmu-benchmark.github.io/WtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[4] https://huggingface.co/spaces/AILab-CVC/SEED-Bench_LeaderboardWtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
[5] https://paperswithcode.com/sota/visual-question-answering-on-mm-vetWtG速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

本文链接:香港大模型公司Weitu AI首秀,打造多模态Native的技术和产品http://www.sushuapos.com/show-2-4675-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 主营构成激变、合规风险待解,“AIGC第一股”出门问问行业参考性几何?

下一篇: GPT-4一眼看穿论文会不会撤稿:7000篇实测准确率高达95%|人大浙大

热门资讯

  • “桃花癫”是种病,得治

    民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精

  • 全国爱肝日丨专家提醒注意“小心肝”

    3月18日是第24个“全国爱肝日”。今年活动的主题是,“早防早筛,远离肝硬化”。重庆多所医院开展义诊咨询活动,通过普及肝病的防治知识,让民众主动筛查

  • 电驱气吸播种机亮相农机展,价格亲民助增产

    3月18日,在2024年黑龙江农机产品展示交易会上,一部可智能播种,又可助力增产的电驱气吸播种机引发众人关注。这台高端智能电驱气吸播种机的价格与机械

  • 人类祖先200万年前开始捕鱼

    美国《发现》杂志网站2月7日刊登题为《200万年前,我们的人类祖先开始从水里捞鱼》的文章,作者是科迪·科蒂尔,内容编译如下:捕鱼可能是一种占许

  • 日学者提出“深海激励化学”新概念

    日本《朝日新闻》近日发表题为《深海之光——极端环境是创意宝库》的文章,作者是樱井林太郎,编译如下:在被称为最后未开垦地的深海,有着低温

  • 肠道菌群关键代谢物可增强抗癌药疗效

    记者3月17日从浙江大学获悉,该校医学院附属第二医院王良静教授团队、附属邵逸夫医院陈淑洁主任医师团队联合研究发现,一种肠道菌群产生的小分子代谢

  • 原来,中国空间站里“四季如春”

    春,推也。从草从日,草春时生也。进入春日,人们时常能在大地回暖、万物复苏中见证旺盛的生命力。一起解锁空间站里的“春日关键词”,感受太空中的“春日

  • 达摩院AI加速农业新品种培育 全球23家科研机构“尝鲜”

    记者3月21日获悉,全球植物科学期刊《分子植物》刊载了中国科学家的最新研究,中国农业科学院作物科学研究所、国家南繁研究院与阿里达摩院(湖畔实验室)

  • 腾讯发布GiiNEX游戏AI引擎 用AIGC助力游戏研发运营

    3月20日,在2024全球游戏开发者大会(GDC)上,腾讯发布了自研游戏AI引擎——GiiNEX。基于生成式AI和决策AI技术,GiiNEX将为游戏全生命周期提供丰

  • 我国网民规模达10.92亿人:互联网普及率77.5%!

    3月22日消息,中国互联网络信息中心(CNNIC)今天发布了《中国互联网络变化状况计算报告》。《报告》显示,截至2023年12月,我国网民规模达10.92亿人,较2022年12

  • 1799元!红米狙击一加Ace3V 简直就是来捣乱的

    一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回

  • “穿上就走”的通用外骨骼面世

    美国佐治亚理工学院机械工程师开发了一种控制机器人外骨骼的通用方法。无需专门训练、特别校准,对复杂算法进行调整后,用户穿上外骨骼就可以直接行走

推荐资讯

  • 日榜
  • 周榜
  • 月榜