近日,华南师范大学人工智能学院硕士研究生张恒(指导老师:黄晋教授)的研究论文《Mitigating Generic Token Dominance in Cross-Domain Foundation Model for Text-Attributed Graphs》从众多投稿中脱颖而出,荣获大数据领域重要国际学术会议 DASFAA 2026(The 31st International Conference on Database Systems for Advanced Applications)最佳论文奖(Best Paper Runner-Up Award)。张恒为该论文第一作者,黄晋教授为通讯作者,合作单位包括 Columbia University、University of Pennsylvania、中国科学技术大学、中国科学院大学和中山大学等。
DASFAA是数据库系统、数据管理与大数据应用领域的重要国际学术会议(CCF B类会议),长期关注数据库系统、知识发现、图数据管理、数据挖掘与智能应用等前沿方向。本届会议于 2026 年 4 月 27 日至 30 日在韩国济州岛举行。

该论文聚焦文本属性图基础模型在跨领域迁移中的关键瓶颈。现有图基础模型通常通过图-文本对比学习对齐图结构与文本语义,但黄晋教授研究团队发现,模型在文本编码过程中容易过度关注“paper”“research”“method”等高频通用词,导致真正具有区分能力的细粒度语义信息被削弱。论文将这一现象概括为 Generic Token Dominance,并通过注意力分析发现,超过70%的注意力权重集中在非判别性的通用词上,从而限制了模型在跨领域零样本和少样本场景下的泛化能力。为解决这一问题,研究团队提出了无需重新训练模型的校准框架 GraphRefiner。该方法通过token decomposition识别并分离通用词与判别性词汇,再利用adaptive semantic modulation动态抑制通用词的主导影响,同时引入 discriminative similarity reasoning进行更细粒度的图文匹配。实验结果表明,GraphRefiner在多个文本属性图基准数据集上均取得稳定提升,在跨领域零样本任务上平均提升 8.3%,在少样本迁移场景中平均提升6.7%,验证了该方法在提升图基础模型跨领域泛化能力方面的有效性。
该成果体现了黄晋教授团队在图学习、基础模型与跨领域迁移方向上的持续积累,也展示了我院在数据智能与图表示学习交叉研究中的创新能力和人才培养成效。