ACM SIGKDD (Knowledge Discovery and Data Mining,简称 KDD)是数据挖掘领域的国际顶级会议。KDD Cup比赛由SIGKDD主办,自1997年开始每年举办一次,是目前数据挖掘领域最具影响力的赛事。
在2024年囊括Meta KDD Cup 24 CRAG三个任务全部冠军的基础上,近日,北京大学计算机学院数据科学与工程所高军教授指导的博士研究生陈嘉尊、夏逸宽、詹宜瑞、赵穗丰组成的DB3队伍,联合华为2012实验室姜伟鹏、张朝瑞、韩伟、白铂等技术专家,在Meta KDD Cup 25 CRAG-MM(Comprehensive RAG Benchmark for multi-modal multi-turn question answering)比赛中,成功蝉联总分第一名。面对相比去年提升的技术难度和更加激烈的竞争环境,团队在三个核心任务中分别获得第2名、第2名和第1名的优异成绩,综合排名第一,并在真实图片数据集评测中荣获Grand Prize特别奖项。
今年的CRAG-MM挑战围绕"多模态综合检索增强生成"(Multi-modal Comprehensive Retrieval-Augmented Generation)技术展开,相比去年的纯文本任务,今年的比赛在技术复杂度上有了显著提升。参赛团队需要处理包含5000张图片的多样化数据集,其中3000张为RayBan Meta智能眼镜拍摄的第一人称视角图像,涵盖13个不同领域,充分反映了现实世界中可穿戴设备面临的技术挑战。比赛要求系统不仅要具备视觉理解、光学字符识别(OCR)、知识检索和文本生成等多种能力的有机融合,还需要支持复杂的多轮对话交互。
竞争环境也比往年更加激烈,今年KDD Cup仅设置一个赛道,吸引了包括去年其他赛道冠军team_NVIDIA、BlackPearl在内的众多顶尖团队参与角逐,NVIDIA、美团等知名企业,中科大、港大、北航等高校也纷纷组队参加,充分体现了比赛的高水平与激烈竞争。
面对技术挑战,DB3团队凭借在检索增强生成、强化学习等技术领域的积累,在视觉语言模型的复杂查询理解和抗幻觉等方面取得了进展,有效提升了多模态RAG系统性能。
DB3团队开源了代码(https://gitlab.aicrowd.com/jiazunchen/db3-team-s-solution-for-meta-kdd-cup-25)供研究者交流学习,并在KDD 2025比赛workshop上提交了相应的方案论文(https://openreview.net/forum?id=WeXV5NydU1)。此外,团队成员还在KDD 2025大会上进行了成果展示。
