设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

AI推理芯片激发新一轮应用创新

2025-01-16 09:57:13 来源: 中国科技网

随着ChatGPT横空出世,人工智能(AI)领域的竞争进入白热化。英伟达公司的高端图形处理单元(GPU)芯片“一飞冲天”,受到各大科技公司追捧。与此同时,也有一些初创公司另辟蹊径,专注于研制另一种芯片——AI推理芯片,为AI产品的蓬勃发展和应用注入全新动力。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据物理学家组织网近日报道,这些AI推理芯片旨在降低生成式AI所需的高昂计算成本,更贴合AI工具的日常运行要求。此类芯片成本的不断下探和性能的持续提升,有望掀起新一轮AI应用创新浪潮,让更多复杂且强大的AI应用走进千家万户。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

推理计算需求水涨船高t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

训练与推理,是AI大语言模型两大核心能力的坚固基石。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在应用过程中,经过训练的ChatGPT等生成式AI工具会吸纳新信息,从中进行推理并生成回应,如撰写文档、生成图像等。这类AI工具可应用于医疗诊断、自动驾驶、自然语言理解等领域。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着AI模型的广泛应用,需要进行推理计算的硬件日益增多,对推理芯片的需求也将“水涨船高”。国际数据公司(IDC)的报告显示,未来几年,推理端的AI服务器占比将持续攀升。预计到2027年,用于推理的工作负载将占据七成以上。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

科技公司竞推新产品t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Cerebras、Groq和d-Matrix等初创公司,以及超威半导体公司(AMD)和英特尔等传统巨头,纷纷推出了AI推理芯片。这些公司敏锐捕捉到了AI推理芯片“大显身手”的契机。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据Cerebras公司官网报道,2024年8月28日,该公司推出了同名AI推理芯片。这款芯片在Llama 3.1-8B模型上实现了1800token/秒的推理速度;在Llama 3.1 70B上实现了450token/秒的推理速度,约是英伟达GPU推理速度的20倍。Token指AI处理文本的最小单元或基本元素,如一个单词、一个字符等。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Cerebras公司解释说,这一卓越表现得益于其创新的AI芯片设计方案。其晶圆级引擎(WSE)宛如一座庞大的“计算工厂”,最大特点是尺寸惊人——单个芯片几乎占据了一整块晶圆的面积。在这个超大芯片上,计算单元和内存单元高度集成,形成一个密集的网格结构。这样的设计,让数据能在极短距离内,于计算单元和存储单元之间传输,从根本上降低了数据移动成本,解决了GPU推理无法避免的内存带宽瓶颈。此类大芯片能更快处理信息,从而在更短时间内给出答案。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

早在去年2月,Groq公司就发布了自己的AI推理芯片GroqCloud。它在Llama 3.1 70B模型上实现了250token/秒的推理服务,速度比GPU几乎提升了一个量级。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

去年11月19日,硅谷初创公司d-Matrix宣布,其首款AI推理芯片Corsair已开始出货,旨在提供聊天机器人和视频生成等服务。Corsair在单服务器环境下,能让Llama3 8B模型实现60000token/秒的处理能力,且每个token的延迟仅为1毫秒,充分彰显了其在高速处理大规模数据方面的卓越性能。更值得一提的是,与GPU及其他方案相比,Corsair能在提供同等性能的同时,大幅降低能耗和成本。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

应用开发走上新赛道t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

亚马逊、谷歌、元宇宙平台、微软等科技公司纷纷斥巨资,抢购昂贵的GPU,以期在AI开发赛道拔得头筹。与此同时,AI推理芯片制造商则将目光瞄准了更广泛的客户群体,希望能在这片新蓝海中大显身手。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这些潜在客户不乏那些渴望利用新兴的生成式AI技术,却又不想大费周章自建AI基础设施的财富500强企业。而且,购买AI推理芯片比从英伟达等公司购买GPU便宜。AI推理芯片旨在优化推理计算的速度与效率,尤其擅长智能建议、语音识别、自然语言处理等领域。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

业内专家称,一旦推理速度提升至每秒数千token,AI模型将能在眨眼之间完成复杂问题的思考与回答过程。这不仅能让现有应用的交互效率实现质的飞跃,还将带来一系列令人耳目一新的人机交互场景。例如,在语音对话领域,延时将被压缩至毫秒级,能实现近乎自然的对话体验;在虚拟现实/增强现实领域,AI将能实时生成和调整虚拟环境、角色对话以及交互逻辑,给用户带来个性化、沉浸式体验。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着ChatGPT横空出世,人工智能(AI)领域的竞争进入白热化。英伟达公司的高端图形处理单元(GPU)芯片“一飞冲天”,受到各大科技公司追捧。与此同时,也有一些初创公司另辟蹊径,专注于研制另一种芯片——AI推理芯片,为AI产品的蓬勃发展和应用注入全新动力。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据物理学家组织网近日报道,这些AI推理芯片旨在降低生成式AI所需的高昂计算成本,更贴合AI工具的日常运行要求。此类芯片成本的不断下探和性能的持续提升,有望掀起新一轮AI应用创新浪潮,让更多复杂且强大的AI应用走进千家万户。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

推理计算需求水涨船高t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

训练与推理,是AI大语言模型两大核心能力的坚固基石。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

在应用过程中,经过训练的ChatGPT等生成式AI工具会吸纳新信息,从中进行推理并生成回应,如撰写文档、生成图像等。这类AI工具可应用于医疗诊断、自动驾驶、自然语言理解等领域。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

随着AI模型的广泛应用,需要进行推理计算的硬件日益增多,对推理芯片的需求也将“水涨船高”。国际数据公司(IDC)的报告显示,未来几年,推理端的AI服务器占比将持续攀升。预计到2027年,用于推理的工作负载将占据七成以上。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

科技公司竞推新产品t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Cerebras、Groq和d-Matrix等初创公司,以及超威半导体公司(AMD)和英特尔等传统巨头,纷纷推出了AI推理芯片。这些公司敏锐捕捉到了AI推理芯片“大显身手”的契机。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

据Cerebras公司官网报道,2024年8月28日,该公司推出了同名AI推理芯片。这款芯片在Llama 3.1-8B模型上实现了1800token/秒的推理速度;在Llama 3.1 70B上实现了450token/秒的推理速度,约是英伟达GPU推理速度的20倍。Token指AI处理文本的最小单元或基本元素,如一个单词、一个字符等。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

Cerebras公司解释说,这一卓越表现得益于其创新的AI芯片设计方案。其晶圆级引擎(WSE)宛如一座庞大的“计算工厂”,最大特点是尺寸惊人——单个芯片几乎占据了一整块晶圆的面积。在这个超大芯片上,计算单元和内存单元高度集成,形成一个密集的网格结构。这样的设计,让数据能在极短距离内,于计算单元和存储单元之间传输,从根本上降低了数据移动成本,解决了GPU推理无法避免的内存带宽瓶颈。此类大芯片能更快处理信息,从而在更短时间内给出答案。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

早在去年2月,Groq公司就发布了自己的AI推理芯片GroqCloud。它在Llama 3.1 70B模型上实现了250token/秒的推理服务,速度比GPU几乎提升了一个量级。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

去年11月19日,硅谷初创公司d-Matrix宣布,其首款AI推理芯片Corsair已开始出货,旨在提供聊天机器人和视频生成等服务。Corsair在单服务器环境下,能让Llama3 8B模型实现60000token/秒的处理能力,且每个token的延迟仅为1毫秒,充分彰显了其在高速处理大规模数据方面的卓越性能。更值得一提的是,与GPU及其他方案相比,Corsair能在提供同等性能的同时,大幅降低能耗和成本。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

应用开发走上新赛道t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

亚马逊、谷歌、元宇宙平台、微软等科技公司纷纷斥巨资,抢购昂贵的GPU,以期在AI开发赛道拔得头筹。与此同时,AI推理芯片制造商则将目光瞄准了更广泛的客户群体,希望能在这片新蓝海中大显身手。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

这些潜在客户不乏那些渴望利用新兴的生成式AI技术,却又不想大费周章自建AI基础设施的财富500强企业。而且,购买AI推理芯片比从英伟达等公司购买GPU便宜。AI推理芯片旨在优化推理计算的速度与效率,尤其擅长智能建议、语音识别、自然语言处理等领域。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

业内专家称,一旦推理速度提升至每秒数千token,AI模型将能在眨眼之间完成复杂问题的思考与回答过程。这不仅能让现有应用的交互效率实现质的飞跃,还将带来一系列令人耳目一新的人机交互场景。例如,在语音对话领域,延时将被压缩至毫秒级,能实现近乎自然的对话体验;在虚拟现实/增强现实领域,AI将能实时生成和调整虚拟环境、角色对话以及交互逻辑,给用户带来个性化、沉浸式体验。t2j速刷资讯——探索最新科技、每天知道多一点SUSHUAPOS.COM

本文链接:AI推理芯片激发新一轮应用创新http://www.sushuapos.com/show-2-10172-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: 瑞典研究警告:AI生成的“垃圾科学”正侵蚀谷歌学术平台

下一篇: 磷化铌薄膜在超薄线路制造中展现潜力 有助解决电子产品能耗问题

热门资讯

  • “桃花癫”是种病,得治

    民俗有言:桃花开,痴子忙。昨日,一大学生患“桃花癫”登上微博热搜,引发热议。该大学生认为周围女生都喜欢自己,并向全校的女生分别告白。不仅如此,由于精

  • 凌晨重磅!英伟达官宣最强AI芯片

    北京时间凌晨4点至6点,英伟达联合创始人兼CEO黄仁勋发表主题演讲《见证AI的变革时刻》,正式拉开了2024年英伟达GTC大会的序幕。黄仁勋宣布,正

  • 我国首个适应高寒气候肉羊品种通过鉴定

    记者19日从兰州大学获悉,天华肉羊通过国家畜禽遗传资源委员会审定鉴定,成为我国首个适应高寒气候的肉羊品种。该品种由兰州大学草地农业科技学院李发

  • Sora将如何影响科学与社会

    英国《自然》周刊网站3月12日刊登题为《OpenAI的文生视频工具Sora会如何改变科学——以及社会》的文章,作者为乔纳森·奥卡拉汉,内

  • 感染新冠会“导致智商下降”吗?

    据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生

  • 人工智能重新定义职场技能

    据阿根廷布宜诺斯艾利斯经济新闻网2月19日报道,在人工智能(AI)迅速重新定义就业格局的今天,通常被称为“软”技能的人类技能成为最有韧性、最有价值

  • CRISPR能消除培养细胞中艾滋病病毒

    荷兰阿姆斯特丹大学医学院科学家开展的一项新研究证明,利用最新CRISPR-Cas基因编辑技术,能消除实验室中受感染细胞内所有艾滋病病毒(HIV)的痕迹,为治愈

  • 12项首创技术助力高速公路改扩建

    记者3月20日来到广东深汕西高速公路改扩建施工现场,看到智能机器人、自动化生产线等智能制造设备在不停运行。3月19日—20日,由茅以升科技教育

  • 南财观察丨操作系统与一座城:全球“鸿蒙之城”深圳造

    21世纪经济报道记者 石恩泽 深圳报道操作系统似乎对地理入迷。鸿蒙和深圳,就像Windows和西雅图,也似Linux和赫尔辛基。这是地理与技术的紧密

  • iPhone迈入AI时代!曝国行版苹果 16 AI效果由百度提供

    3月23日消息,据媒体报道,iPhone与百度公司已达成合作协议,百度将为苹果内置的生成式人工智能大模型提供技术支持。报道指出,iPhone生成式人工智能大模型的

  • 苹果 16首发预装!iOS 18将支持桌面自定义、引入大模型

    3月25日消息,按照惯例,iPhone会在6月份的WWDC上发布iOS 18、watchOS 11、visionOS 2等全新系统。其中iOS 18比较受关注,被许多爆料者称为iOS史上最大升级

  • 北京市青少年科学教育基地揭牌

    为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科

推荐资讯

  • 日榜
  • 周榜
  • 月榜