您现在的位置: 首页 » 学科建设 » 产学研合作 » 正文

学科建设

产学研合作


一、成果简介

2024年4月北大李戈团队推出全新自研7B代码大模型,代码生成与补全功能效果超越同级别及更高参数规模开源模型。该模型在多个主流评估标准评测集中,与所有同量级开源模型对比,在代码生成与补全的功能上效果最佳,彰显出其作为百亿参数天花板级代码大模型的非凡实力。

aiXcoder-7B模型自开源后,截止到9月初,在软件源代码托管服务平台GitHub上的Star数已超过2.2k,Hugging Face下载量5.8k。

1.代码生成能力优异

7B模型在各大百亿级参数规模代码大模型上表现最佳,甚至超过参数规模是其5倍的CodeLlama。

2.上下文单行代码补全效果最佳

在真实场景测评集上,7B Base版(开源)对比同参数量级模型,综合效果最佳。

测评集:Santacoder(Ben Allal et al., 2023)

3.多行代码补全表现优异

aiXcoder扩展基准测试集(aiXcoder Bench)上,aiXcoder 7B Base版表现出相较于其他代码大模型的一大亮点,倾向于使用较短代码来完成指定的任务。

4.跨文件代码补全测评效果卓越

在评估代码大模型提取跨文件上下文信息能力的CrossCodeEval测评集上,aiXcoder-7B拿到同级别模型的最好效果。

二、应用领域和市场前景

目前已为金融、军工、航空航天、IT、能源、智能制造等行业头部企业提供专业软件工程领域大模型,以及企业领域化大模型落地的定制化服务,覆盖多元落地场景。

参考工信部前瞻产业研究院发布的数据,2023年,全国软件和信息技术服务业规模以上企业超 3.8 万家,累计完成软件业务收入 12万亿元,同比增长13.4%。2013-2023 年,软件行业收入占我国 GDP 的比重从 5.14% 上升至 9.78%。

Gartner将AI增强软件开发列入2024十大战略技术趋势,并预测2028年预计有75%的企业软件工程师将使用AI编码助手辅助工作。根据我国专业开发者社区CSDN发布的《2024中国开发者调查报告》显示,AI技术已成为我国软件开发者工作中不可或缺的一部分,有69%的开发者表示正在使用AI工具。

三、合作方式

合作开发、技术服务及咨询、技术许可、招商引资、企业合作等。


对接方式

1.合作意向方联系北京大学计算机学院产学研合作办公室;

2.产学研合作办公室沟通了解意向方情况;

3.会同成果完成团队与意向方共同研讨合作方案。


北京大学计算机学院产学研合作办公室

邮箱:hecheng1213@pku.edu.cn

未经授权,请勿转载