计算机学院图形与交互技术实验室汪国平教授与李胜研究员的研究团队在ACM SIGGRAPH系列会议上取得系列进展。ACM SIGGRAPH和SIGGRAPH Asia是计算机图形学与交互技术领域最具权威性的年度学术会议(CCF A类)。该系列会议以理论、方法的创新性和技术贡献方面审核严苛而闻名,论文成果往往工作量浩大、研究周期长、技术挑战高,而录取率一般20%左右。本年度,该研究团队共接收/发表6篇长文(regular technical paper),其中SIGGRAPH2篇,SIGGRAPH Asia4篇, 所有论文均在大会做口头报告。
1. Proxy Tracing: Unbiased Reciprocal Estimation for Optimized Sampling in BDPT
基于全局光照的高度真实感渲染是图形学的核心问题之一,鲁棒的光传输算法,特别是双向路径追踪(BDPT),在处理涉及镜面反射或高度光滑等困难路径时面临重大挑战,采样十分困难。为了解决这个问题,论文提出了一种称为代理采样的新方法,该方法可以有效地连接这些难以采样的路径。新构建完整路径确保连接遵循镜面/光滑表面的窄叶BSDF约束。无偏的倒数积分的估计是方法的关键,用于获得与无偏渲染相一致的概率密度函数(PDF)。方法显著地提升了BDPT渲染方法的效率,并可以高效地采样那些困难的路径,从而提升渲染效果。
论文发表于SIGGRAPH’24期刊轨(ACM Transactions on Graphics期刊),共同第一作者为实验室研究生苏复佳和本科生李秉轩,合作者包括本科生尹清扬、章严晨、李胜研究员(通讯作者)。
2. DiffSound: Differentiable Modal Sound Rendering and Inverse Rendering for Diverse Inference Tasks
准确估计和模拟物体的物理属性从现实世界的声音录音中提取,对于视觉、图形和机器人等领域具有重要的实际意义。以往的刚体或软体模拟技术无法直接应用于模态声音合成,因为音频的高采样率,而以前的声音合成器往往未能充分建模发声物体的准确物理属性。论文提出了DiffSound,一种用于基于物理的模态声音合成的可微声音渲染框架,该框架基于隐式形状表示、新的高阶有限元分析模块和可微音频合成器。论文方法能够解决广泛的逆向问题,包括物理参数估计、几何形状推理和撞击位置预测。
论文发表于SIGGRAPH’24会议轨,共同第一作者为实验室直博生金旭统和硕士生徐晨曦,合作者包括斯坦福大学助理教授吴佳俊、马里兰大学助理教授高若涵、汪国平教授、李胜研究员(通讯作者)。
3. Neural Laplacian Operator for 3D Point Clouds
图形学中几何处理中的核心算子之一是拉普拉斯算子,其在物理仿真、几何计算等下游应用中具有重要地位。拉普拉斯算子起初定义在流形上,在三角网格和多边形网格等具有拓扑结构的三维表示方式中可以较为自然地推广,但对于点云这样的缺乏拓扑信息的无序结构而言,构建拉普拉斯算子及进行后续运算是非常困难的。论文探究了如何在不构建三角化或重建网格的情况下,通过观察拉普拉斯算子的性质,利用图神经网络估计点云上的拉普拉斯算子。为了训练网络,提出了一种新的训练方案,通过构建一个个“探测器”,不断“探测”目标拉普拉斯算子的性质,从而训练出一个具有泛化性的,用于预测点云上拉普拉斯算子的图神经网络。论文被SIGGRAPH Asia’24期刊轨(ACM Transactions on Graphics期刊)接收,第一作者为实验室直博生逄博,合作者包括研究生郑中天、李翼龙、汪国平教授(通讯作者)和王鹏帅助理教授(通讯作者)。
4. Barrier-Augmented Lagrangian for GPU-based Elastodynamic Contact
弹性体接触仿真是图形学仿真中最具挑战性的问题之一,Incremental Potential Contact (IPC)作为近年来图形学与接触力学领域的重要突破,提供了深刻的数学建模。然而,其实现通常依赖于带障碍函数的非线性优化,并涉及复杂且计算密集的矩阵运算。由于矩阵病态性,IPC的实现往往需要采用直接法进行计算,但直接法的矩阵分解过程导致内存占用极大。针对上述问题,论文对IPC模型实现了高效优化方法。具体来说,论文提出了基于障碍的增广拉格朗日迭代模型,用预条件共轭梯度(PCG)替代了直接法来求解子线性系统。同时,对超大规模稀疏矩阵的存储方式进行了革新,跳过了稀疏矩阵模式(pattern)的计算,在确保稀疏性存储的基础上完全省略了这一步骤。得益于此优化,方法在IPC基础上实现了近百倍的计算效率提升,且由于取消了矩阵分解,内存开销从128G以上降低到只需8G,而且还能解决刚性的病态问题。论文被SIGGRAPH Asia’24期刊轨(ACM Transactions on Graphics期刊)接收,第一作者为实验室博士生郭德闻,合作者包括CMU助理教授李旻辰和犹他大学副教授杨垠、李胜研究员(通讯作者)和汪国平教授(通讯作者)。
5. Efficient Neural Path Guiding with 4D Modeling
以往的路径引导策略使用3D的数据结构来建模空间位置与入射辐射度分布间的关系,但较难建模除空间位置(3D)之外的维度,例如动态场景在时间维度上的变化。而将这些数据结构直接扩展到更高的维度却常因维度诅咒而导致运行低效。论文探究如何由紧致的神经隐式表示来高效地建模辐射分布所依赖的额外维度,从而增强路径引导算法在特定渲染应用中的性能,例如光谱渲染与动态场景中的运动模糊效果。具体而言,论文使用特征平面分解的策略建模空间位置与额外维度间的相关性;同时提出使用渐进式的训练策略近似这种相关性,从而避免额外的数据结构开销。论文在若干典型的渲染应用与困难场景下体现了优势。论文被SIGGRAPH Asia’24会议轨接收,第一作者为实验室硕士生董宏昊,合作者包括研究生苏睿、汪国平教授、李胜研究员(通讯作者)。
6. Dynamic Neural Radiosity with Multi-grid Decomposition
神经渲染是一种崭新的利用AI实现真实感渲染的技术。然而,现有基于神经网络的动态场景全局光照方法,由于模型复杂性较高,每帧图像生成耗时较长,导致帧率较低。为了解决这一问题,论文提出了一种特征分解方法。该方法将动态场景向量与空间坐标构成的高维特征分解为三部分:三维空间网格特征、多个二维时空平面特征以及频率编码的向量间特征,从而解决了维度灾难问题,实现了一种高效的高维特征表示方式。同时,该方法在动态场景向量空间中均匀采样,并通过渲染方程的残差训练神经网络,最终生成视角无关的动态场景辐射场。与现有神经渲染方法相比,该方法不仅提高了图像质量,还将帧率提升了约3.5倍,支持交互时间内渲染动态场景。论文被SIGGRAPH Asia’24会议轨接收,论文第一作者为直博生苏睿,合作者包括实验室研究生董宏昊、任杰瑞、金浩杰,以及陈毅松老师、汪国平教授和李胜研究员(通讯作者)。