您现在的位置: 首页 » 教工之家 » 新闻动态 » 正文

教工之家

新闻动态

计算机学院开展第五期计星启程师生面对面交流活动

610日下午,计算机学院在第二教学楼3W咖啡厅开展第五期计星启程师生面对面交流活动。本次活动邀请北京大学前沿计算研究中心助理教授王若松老师与多位研究生深入交流,计算机学院团委书记于丹老师、视频所崔建华老师一同参与。

第五期计星启程师生面对面交流活动合影

师生围绕强化学习理论及应用前景开展面对面交流活动。王若松老师系统阐释了强化学习模型在复杂任务中的表现水平,并分析了大模型推理能力的真实性问题,及其在严谨逻辑场景下与人类专家的差距。在强化学习理论层面,王老师重点讨论了强化学习目标的明确性及其在算法收敛性分析上的应用,并展望了利用该理论解析模型行为、优化学习路径的未来研究方向。在职业规划层面,王老师结合自身从博士深造到归国执教的学术历程,建议同学们积极地进行跨领域的学术交流,对自己追求的科研方向与工作前景有深入的思考,选择与自身相匹配的科研环境。

王若松与学生们亲切交流

本次访谈交流活动深深地启发了学生对以后研究方向和未来学术发展的深入思考,在场师生均表示将一起致力于将数据科学领域的学术研究与成果转化推向全新阶段。

 

 

 

 

 

 

部分精选师生对话:

 

汪文韬同学 当前在大模型领域,强化学习被普遍视为激发模型推理能力的关键手段之一。然而,也存在观点认为大模型并未实现真正类人的推理过程。请问您如何看待大模型本身的推理能力?它们是否真正具备了推理能力?

王若松老师 上学期我为本科生开设了《信息学中的概率统计》课程。课程试题由我设计,均需要一定的思考与推理能力作答,且难以在网上找到类似答案。我将这些题目输入给 DeepSeek 模型进行解答,其作答水平甚至可以达到北大本科生前10%的水平。实际上,复杂且严密的推理能力在人类中也十分稀缺。大模型的表现或许能在人群中排到较前位置,但在需要大量、严谨逻辑推导的场景下,其与人类顶尖水平仍存在差距。

彭广岳同学 当前大模型的可解释性研究,主要侧重于对模型行为及输出现象的解释,似乎尚未与底层的机器学习理论建立起较为系统的联系。您认为强化学习理论应如何应用于实践,以解释并进一步提升模型能力?

王若松老师 相较于大模型预训练阶段的表示学习目标,强化学习的目标函数(即不同状态下采取不同策略所获得的累积回报)具有更明确的定义。因此,其理论分析通常更聚焦于算法的收敛性。在我们已习得有效表示的前提下,如何利用强化学习理论来解析模型行为、探索更优的强化学习路径,也将是我们未来重要的研究方向。

 

计星启程师生面对面交流活动

 

通过采访计算机学院2024年新入职教师,宣传展示新入职老师的研究方向与科研成果,帮助广大学生了解学院新入职教师们的科研方向及亮点,方便学生自主科学地选择课程及导师,坚定科研方向。同时进一步加强年轻教师与学生们的沟通,形成学--教融合的有机体系,助力学院学科建设高质量发展。