设置
  • 日夜间
    随系统
    浅色
    深色
  • 主题色

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

发布时间: 来源: 量子位

GraphGPT原班人马出品HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

一个模型建模所有图结构关系——HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

香港大学数据智能实验室最新图结构大模型来了。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它叫HiGPT,由GraphGPT原班人马打造。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

后者是将图数据与大模型结合的代表方法之一HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通过用图指令微调将图数据与大模型对齐,在下游任务上一度彰显了惊人的泛化性(Zero-Shot)。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

不过,GraphGPT仅针对同质图进行了验证,对于生活中更常出现的异质图 “无能为力”。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

简而言之,也就是只擅长简单的任务,复杂的还不行。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

(异质图:即结点和边的类型更多样。例如社交网络中用户、帖子和评论之间的关系)HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

基于此,HiGPT诞生,专攻复杂的异质图学习任务,并真正做到了“一个模型,建模任意关系类型”。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

由此,一个通用图大模型就诞生了。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

以后我们无论是用大模型做社交网络分析、生物信息还是城市计算这些常见图任务,都能hold更多有难度的case了。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

Hi,异质图GPT

想要一个模型实现所有异质结构关系的泛化,面临的挑战有三:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

C1. 关系类型异质性偏移:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

当前几乎所有的异质图神经网络在建模异质关系是常常会为单个异质图的每个节点和关系类型定制参数,这使得当不同异质图之间结点和关系类型发生改变时,即关系类型异质性偏移,zero-shot的泛化将非常困难。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

C2. 复杂异质图结构:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

由于异质图存在多种多样的异质结点和关系类型,如何让大语言模型具有分辨不同异质类型的能力,从而提取有用的异质结构信息,进一步完成各种下游任务的泛化也是需要考虑的问题。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

C3. 模型微调的数据稀缺:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

在图学习研究社区,数据不足或者数据确实问题是公认的挑战。如何在有限的监督信号下学习得到更强泛化的模型也是不可避免的问题。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

那么,具体来看看,HiGPT是如何实现的。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

该方法的框架图如下所示:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

针对C1,C2,C3,作者分别提出S1,S2,S3对应解决:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

S1. 上下文异质图Tokenizer。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了在具有不同节点和边类型的各种异质图场景中实现泛化性,我们引入了上下文异质图Tokenizer。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这个Tokenizer捕捉到了不同异质图中存在的各种语义关系,提供了一个统一的建模方法。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

它包括两个重要组件:1)上下文参数化异质性投影器:利用自然语言对不同的节点和边类型进行编码;2)参数分配器:动态地为Tokenizer分配定制的参数。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

为了优化性能并将Tokenizer无缝集成到HiGPT框架中,作者采用了轻量级的文本-图对比对齐范式来预训练Tokenizer。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

预训练之后,直接将Tokenizer集成到HiGPT中,经过预训练的Tokenizer提高了其语义建模能力,并确保了其在整个模型架构中运行平稳。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

S2. 异质图指令微调。 作者引入了一种新颖的异质图指令微调框架,该框架引入了跨类型和同类型token匹配任务来微调大语言模型。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

框架专门针对提高大语言模型对异质关系感知和同质关系感知的理解。通过这些任务,作者的目标是增强大语言模型在以下方面的能力:
(i)区分不同类型的图tokens(异质关系感知),(ii)区分相同类型的图tokens直接的对应关系(同质关系感知),以及(iii)在下游任务中有效利用异质关系感知和同质关系感知能力。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

设计的指令微调任务的指令模版如下表所示:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

S3. Mixture-of-Thought指令增强。 为了解决异质图学习下游任务监督信号不足的问题,作者引入了一种用于增强图指令的新机制Mixture-of-Thought(MoT),即混合各种提示技术结合使用。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

这种集成使我们能够生成一组多样化和全面的信息丰富的下游任务指令。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通过无缝地将这些增强的图指令集成到框架中,将有效地解决数据稀疏性的挑战。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

具体地,作者结合了四种常见的提示技术,即Chain-of-Thought,Tree-of-Thought,PanelGPT和Generated Knowledge Prompting,通过ChatGPT模拟正确的推理结果,最后将多样的推理结果作为下游任务指令微调的训练数据,做到不增加监督信号的情况下增加(增强)了训练数据规模。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

工作流程如下图所示:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

具体提示与增强指令模版如下图所示:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

HiGPT不仅在监督学习(Supervised)和零样本(Zero-shot)学习中超越了一众主流模型:HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

同时,作者探索了用训练得到的HiGPT进行图上下文学习(Graph In-Context Learning),然后惊奇地发现,在不优化模型参数,仅仅添加图问答示例就可以使得在1 shot训练的模型打败60 shot模型。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

进一步的案例分析作者发现HiGPT不仅可以根据问题灵活调整回答推理模式,甚至会从主动从图数据角度分析问题,有了一定的图-意识(Graph-Awareness)。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

研究团队

本项研究由港大数据智能实验室的GraphGPT原班人马以及百度等机构的研究人员完成。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

港大数据智能实验室由黄超老师带领,在图学习,推荐系统,城市计算等诸多数据挖掘领域都有持续的探索,尤其是近期与大语言模型的诸多开源工作:GraphGPT,HiGPT,LLMRec,RLMRec,UrbanGPT,GraphEdit等。HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度

欢迎大家来Github进一步探索!HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

传送门:
论文:https://arxiv.org/abs/2402.16024HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
代码:https://github.com/HKUDS/HiGPTHQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
项目网站:https://higpt-hku.github.io/HQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://sites.google.com/view/chaoh/group-join-usHQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM
https://github.com/HKUDSHQr速刷资讯——每天刷点最新资讯,了解这个世界多一点SUSHUAPOS.COM

  监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,人工智能(AI)领域的激烈竞争,对该领域的监管 据英国《泰晤士报》网站3月15日报道,2020年1月,英国帝国理工学院的亚当·汉普希尔与英国广播公司合作,对8万人进行了30分钟的测试,目的是揭示生活方式的改变会影响我们的大脑功能。三个月 21世纪经济报道记者王峰北京报道 近日,全球教育集团培生(NYSE:PSO)公布2023财年财报。2023财年,培生的销售额为36.74亿英镑(下同),同比下降4%,但基础销售额同比增长1%;调整后营业利润5.73亿,同 2024年2月,OpenAI公司推出了文生视频人工智能(AI)模型Sora。OpenAI展示了Sora利用少量简短文字提示即可创建逼真视频的能力,并提供了包括一位女士在闪烁着霓虹灯的东京街道漫步,以及一只狗在两个   我国成功发射云海二号02组卫星  中新网北京3月21日电(马帅莎 曹译 张艳)北京时间2024年3月21日13时27分,我国在酒泉卫星发射中心使用长征二号丁运载火箭/远征三号上面级,成功将云海二号02组卫星发射升空,卫星顺利 “人工智能作为数字新基建重点建设方向,前景广阔,大有作为。今年的政府工作报告更首次提出开展‘人工智能+’行动,无疑将为人工智能技术在国内各行各业的广泛应用开启新篇章。”3月22 。

本文链接:通用图大模型HiGPT:一己之力建模任何图结构关系!来自港大数据智能实验室&百度http://www.sushuapos.com/show-2-4229-0.html

声明:本网站为非营利性网站,本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇: Kimi宕机打醒巨头!阿里百度360连夜出手,大模型商业化厮杀开始

下一篇: Sora三巨头首次解密幕后信息,CTO:最快年内开放

热门资讯

  • 监管AI,欧盟出手,美国掉队?

      监管AI,欧盟出手,美国掉队?  上个世纪,科幻小说家艾萨克・阿西莫夫提出了“机器人三定律”,带来了对“机器人”与“规则”的美好幻想。  如今,伴随着ChatGPT、Sora的爆火,

  • 全国首个模拟验证机场开工

    记者日前获悉,位于四川成都未来科技城应用性科创区的民航科技创新示范区(B区)航站楼项目,近日取得施工许可证。这也意味着全国首个模拟验证机场开工。

  • 239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远

      239万的无人驾驶航空器淘宝上架,人人可以“打飞的”还有多远  239万元/架的无人驾驶载人航空器也看上了电商渠道。  3月18日,亿航智能设备(广州)有限公司(下称“亿航

  • 什么是“时空连续体”?

    英国“我超爱科学”网站1月1日刊登题为《什么是“时空连续体”?》的文章,作者是斯蒂芬·伦茨,内容编译如下:“时空连续体”(space-time continuu

  • 突发!Kimi,崩了!

    因流量突然剧增,3月21日,陆续有用户在社交平台上表示,月之暗面旗下大模型应用Kimi智能助手的APP和小程序均无法正常使用。截至记者发稿时,相关

  • 植物避盐性的关键基因被发现

    记者3月21日从安徽农业大学获悉,该校生命科学学院韩毅教授课题组与国内外专家合作,发现了植物避盐性的关键基因。该研究对于提高植物耐盐性,帮助盐碱

  • 研究:“16:8”间歇性禁食可能与心脏病死亡风险上升相关

    据一项在本周举行的美国心脏协会会议上提交的新研究,每天进食时间控制在8小时内的间歇性禁食方法可能与心脏病死亡风险上升相关。近年来越来越流行

  • GPU持续升级 如何应对算力“贫富差距”

    英伟达的GPU又升级了。3月19日,英伟达CEO黄仁勋发布了最新的B200算力芯片GPU,FP8精度下的训练性能是上一代的2.5倍,FP4精度下的推理性能更是达到了上

  • 1799元!红米狙击一加Ace3V 简直就是来捣乱的

    一加Ace 3V刚发布,就被红米砍了一刀!随着昨天一加Ace 3V的发布,新一轮中端机的内卷终于拉开了序幕。 而且这电话售价居然还不增反降,直接1999起步。 先来回

  • iPhone可能在国内设备使用百度AI技术:集成于iOS 18

    有消息称,iPhone在中国寻找本土生成式AI提供方,iPhone讨论了在中国的设备中使用百度的人工智能技术。据《华尔街日报》报道,iPhone与百度进行了谈判,以授权

  • 为什么有人以为安卓拍照可以打iPhone 答案就这么直接

    聊到安卓电话的拍照,大部分用户还是比较认可的,而在与iPhone电话的对比中,用户也普遍以为安卓电话的拍照水平要比iPhone更好,当然这一说法也并非空穴来风,其

  • 北京市青少年科学教育基地揭牌

    为构建有效联动、密切配合的青少年科学教育协同机制,提升科学教育实施效能,3月23日,北京市关心下一代工作委员会(以下简称“北京市关工委”)、北京市科

推荐资讯

  • 日榜
  • 周榜
  • 月榜