本组博士后琚玮,本科生覃义方等人合作发表数据挖掘领域顶级会议ICDM 2022论文Kernel-based Substructure Exploration for Next POI Recommendation(通讯作者张铭教授),并荣获最佳论文提名奖。论文提出同时探索用户行为序列中时序影响和空间影响的POI推荐模型。该模型分别利用图神经网络和图核的优点去捕捉地理模块中的拓扑空间位置影响和序列模块中的高阶序列子结构影响,两者从互补的角度捕捉用户的行为偏好,并引入一致性学习框架通过知识交互的方式使两个模块相互增强,更加个性化地在搜索效率和兴趣发现两方面提升用户体验。[论文链接]
本组博士生王一帆领衔的论文DisenCite: Graph-based Disentangled Representation Learning for Context-specific Citation Generation被AAAI-22高分接收。该文基于构建的异构引文网络,提出了一个解耦合图神经网络用于提取“引用-被引”论文对中的文本和引用拓扑信息,并进行引用章节预测和特定位置的引文生成,所提出的模型DisenCite获得了当前的最佳性能。通讯作者为国防科技大学讲师宋伊萍(Dlib毕业博士)、张铭教授。其余作者为李帅,程超然,琚玮,王晟。[论文简介链接]
本组博士生刘泽群、本科生王舒恺、博士生顾怿洋、本科生张睿一等人合作发表自然语音领域顶会EMNLP 2021论文Graphine: A Dataset for Graph-aware Terminology Definition Generation(通讯作者张铭教授和校友王晟)。论文提出了一个大规模生物医学定义数据集,包含200w条左右的医学名词-定义对,涵盖227个子领域,并为每个领域构建了表示名词间关系的图,利用图上邻居结点的定义,辅助定义的生成。该工作提出一种融合图信息的Transformer模型,创新地利用局部和全局信息生成定义。该数据集与模型在定义生成上的表现显著超过基线模型,并能作为benchmark用于更多任务上。[论文链接][数据集][视频]
本组博士生沈剑豪的Findings of EMNLP 2021论文(通讯作者张铭教授)Generate & Rank: A Multi-task Framework for Math Word Problems 提出了一种多任务数学问题求解框架,采用生成候选表达式再排序的方式求解数学问题,并联合训练生成和排序模块,在Math23K上准确率比之前的SOTA模型提升了7%。[论文链接][论文简介链接][视频]
本组博士生李想发表于IJCAI2016的论文StalemateBreaker: A Proactive Content-Introducing Approach to Automatic Human-Computer Conversation获得《每日邮报》报道和北大新闻报道。
本组博士毕业生唐建领衔发表的论文Visualizing Large-scale and High-dimensional Data提出的 LargeVis 是一种基于LINE的高维数据可视化算法,比 t-SNE 更快更稳定而且有更好的可视化效果;获得WWW 2016 Best Paper nominee奖项。
本组博士毕业生唐建领衔发表的论文LINE: Large-scale Information Network Embedding提出了高效的网络嵌入表征学习算法LINE,是图神经网络计算领域著名的算法,是WWW 2015被引最多论文(2022.3.8 谷歌学术引用超过5100余次)。
Jian Tang, Zhaoshi Meng, XuanLong Nguyen, Qiaozhu Mei, Ming Zhang. Understanding the Limiting Factors of Topic Modeling via Posterior Contraction Analysis. ICML 2014: 190-198机器学习顶会 ICML Best Paper