一、成果简介
人工智能生成技术与应用是推动图像、视频、文本、音频等多领域创新发展的核心动力。本研究团队专注于生成式人工智能的前沿探索,涵盖多项创新方向和关键技术:在人体图像生成与三维重建领域,团队提出多模态生成模型,显著提升了从人体姿态到表情生成再到三维重建的精度与细节;在场景图像生成与理解方向,团队开发了基于GAN和Transformer的生成框架,为跨领域图像翻译和语义合成提供技术支持;在自动驾驶领域,团队构建了融合多传感器数据的生成与分析系统,增强了复杂交通环境下的感知与决策能力;在图结构与点云模态分析中,结合图神经网络和生成对抗网络,突破了多维数据生成与处理的瓶颈,为智能制造等高技术领域提供先进工具。
此外,团队在低级视觉任务(如超分辨率、去噪)、高效人工智能(如高性能量化模型设计)、深度网络设计(如扩散模型和Mamba模型优化)以及鲁棒性与可解释性人工智能(如对抗样本检测与解释性增强)等方向取得了重要突破。这些研究不仅推动了生成式人工智能在多模态交互、内容创作等领域的实际应用,还为解决复杂现实问题提供了创新的技术方案和理论支持。
12个研究方向上取得的代表性成果
每个研究方向的代表性成果介绍:https://ha0tang.github.io/
二、应用领域和市场前景
生成式人工智能技术正逐步展现其广泛的应用领域和巨大的市场前景。本研究团队在多模态生成技术领域的成果,从人体图像生成到三维重建,不仅显著提升了生成效果的精度与细节,还在虚拟现实、影视制作、游戏开发、数字人以及在线教育等领域展现了广泛的应用潜力。在场景图像生成与理解方面,团队开发的生成框架为智慧城市建设、建筑设计和无人驾驶仿真等复杂场景提供了技术支持。针对自动驾驶领域,团队提出的多传感器融合系统,可广泛应用于无人配送和低空经济等前沿产业,助力提升交通安全性与运行效率。图结构和点云模态分析技术,则广泛服务于建筑布局优化和复杂系统模拟等高技术需求场景。
此外,团队在超分辨率和图像去噪方向的技术突破,直接应用于医疗影像处理、视频流优化、移动端拍摄增强和数字化档案修复等领域;高效人工智能技术,为设备端模型部署和低功耗AI应用提供了有力支持;鲁棒性与可解释性人工智能技术则在金融风控、网络安全和医疗诊断等高可靠性场景中发挥重要作用。这些技术创新,不仅推动了多模态交互、智慧城市建设等领域的深度融合,还将在全球人工智能市场中占据重要地位。
三、合作方式
合作开发、技术服务和咨询、技术转让。
对接方式
1.合作意向方联系北京大学计算机学院产学研合作办公室;
2.产学研合作办公室沟通了解意向方情况;
3.会同成果完成团队与意向方共同研讨合作方案。
北京大学计算机学院产学研合作办公室
邮箱:hecheng1213@pku.edu.cn
未经授权,请勿转载