电子科技大学智能计算研究院博士生在数据挖掘顶级会议SIGKDD发表论文

来源:电子科技大学智能计算研究院 发布时间:2024-12-23 15:22:42

电子科技大学智能计算研究院在数据挖掘方向的研究成果《GraphTool-Instruction: Revolutionizing Graph Reasoning in LLMs through Decomposed Subtask Instruction》被数据挖掘领域顶级会议(ACM SIGKDD Conference on Knowledge Discovery and Data Mining)接收。SIGKDD是中国计算机学会A类推荐会议。

由支部书记秦科教授指导的博士研究生王荣正为论文第一作者,梁爽副研究员为通讯作者,论文合作者还包括电子科技大学陈麒至博士,张嘉晟博士。论文第一单位为电子科技大学。

在当前以数据驱动为核心的时代,图数据因其在表示复杂关系和网络结构方面的有效性而变得极为重要。然而,尽管大型语言模型(Large Language Models, LLMs)在自然语言处理等领域表现出色,它们在处理图数据时面临着显著挑战。图结构具有高度连通性、丰富的组合属性和非欧几里得特性,这使得它们的处理方式与传统的文本或图像数据截然不同。研究表明,尽管LLMs能够理解图的基本属性并解决一些图推理任务,但在图理解(Graph Understanding, GU)和图处理(Graph Processing, GP)这两个方面,它们的准确性仍然有待提高。

为了解决这些问题,本论文提出了一种新颖基于工具指令微调的方法——图工具指令方法(GraphTool-Instruction),该方法通过将图推理任务分解为三个面向图工具执行的子任务:图提取、工具名称识别和工具参数提取,以增强LLMs在处理图数据时的性能。这种方法不仅同时提高了图理解与图处理能力,还为图推理任务提供了一种新的、高效的解决方案。此外,本论文还开发了一个全新的图工具指令数据集GTools,包括20种不同类型的图推理任务,并基于此数据集开发了基于Llama3-8B的开源大语言模型GraphForge

pic

相关链接:

SIGKDD会议,全称为ACM SIGKDD Conference on Knowledge Discovery and Data Mining(国际计算机学会数据挖掘与知识发现专业组会议),是数据科学领域中最具影响力的国际学术会议之一,被中国计算机学会列入A类推荐会议。它由ACM(Association for Computing Machinery,国际计算机学会)旗下的SIGKDD组织主办,该组织专注于推动数据挖掘、大数据分析以及相关领域的研究与发展。

王荣正,智能计算研究院2024级博士研究生。曾获电子科技大学研究生学业奖学金一等奖;第十三届MathorCup高校数学建模挑战赛三等奖;电子科技大学优秀研究生。




责任编辑:秦科
电子科技大学智能计算研究院在数据挖掘方向的研究成果被数据挖掘领域顶级会议ACM SIGKDD接收
支部理念:聚焦国家重大战略需求,承担国家重大科技任务。面向真需求,解决真问题,作出真贡献