您现在的位置: 首页 » 学院新闻 » 新闻动态 » 正文

学院新闻

新闻动态

ACM SIGCOMM 2024上,北京大学计算机学院共有5篇高水平论文入选。作为计算机网络系统领域历史最为悠久也最为权威的学术会议,SIGCOMM以其严苛的标准著称,对论文的质量要求极高,要求所录用的论文具有基础性贡献、领导性影响和坚实系统背景。本年度ACM SIGCOMM共有366篇投稿,录用62, 录取率不到17%,为近五年最低录取率。

计算机学院此次被SIGCOMM录用的5篇论文,研究成果涵盖多个领域,包括高效网络流量验证、全覆盖监测框架、可扩展Sketch部署框架、网络配置匿名技术、和新型数据中心传输协议等。以下是论文简要内容介绍:

 

一、面向大规模生产环境核心网与任意故障场景的流量负载属性验证系统

descript

为全球用户提供高速稳定的互联网服务需要连接全球数据中心的大规模核心网,验证流量负载在任意k点故障下仍符合预期(如不超过链路带宽的80%)是提高网络容错能力、避免不可预测的随机故障场景下服务中断或服务质量下降的有效手段。然而,过去的工作或无法支持在生产环境下使用的复杂网络协议、或仅能够低效地逐个枚举具体的故障场景进行耗时的检查。论文“A General and Efficient Approach to Verifying Traffic Load Properties under Arbitrary 𝑘 Failures”首次同时解决了这两个问题。论文提出了通用且高效的流量负载属性验证方法YU:受符号执行的思想的启发,YU首先对任意故障场景下的各类转发协议进行了建模,以此解决通用性的挑战;以多端二元决策图(MTBDD)为基础,YU进一步在验证过程中动态识别k故障等价性与链路局部等价性,并依照等价性化简流量负载的计算表达式,以此解决了高效性挑战。实验评估表明YU相比与此前工作在同等条件下性能提升可达2042倍。YU在阿里云含近千台设备的核心网中得到了部署,部署效果表明其能够在28.6分钟内完成任意2点故障的流量属性验证,验证结果揭露了网络中隐藏的多个潜在隐患。该论文第一作者为计算机学院2022级博士生李睿涵(导师为许辰人副教授),作者包括许辰人,阿里云袁驿飞、叶方丹、刘孟启、杨睿震、蔡德忠和翟恩南等。

 

二、面向复杂数据中心网络的可扩展的全覆盖监测框架

descript

物理层的监测全覆盖对于保障数据中心的服务可用性至关重要。然而,由于数据中心底层网络中的流量技术日趋复杂,精确统计覆盖率指标都变得富有挑战性,遑论达到全覆盖的监测要求。事实上,覆盖率空洞在生产环境集群里广泛存在,并成为业务漏告警的一个核心原因。针对此挑战,论文 “RD-Probe: Scalable Monitoring With Sufficient Coverage In Complex Datacenter Networks” 提出了全新的监测框架 RD-Probe,并显式提供了全覆盖和可扩展性的保证。RD-Probe首先利用设备层的配置信息,将底层技术引入的虚拟化和随机化行为编码进拓扑图。然后,其利用拓扑图,并综合随机性与确定性的拨测技术,通过二阶段方案快速达到任意预先指定的覆盖率要求,同时平衡关键资源的开销。RD-Probe已经部署在华为云的三个分别包含千台交换机的集群中,将估计覆盖率从此前的80.6%提升至99.6%,并且辅助检测到诸多此前被忽略的网络侧问题。 此外,我们进行了更大规模集群的仿真,并对比了其他三种业界部署的典型监测方案。RD-Probe是唯一一个在复杂流量技术场景下同时实现全覆盖和可扩展性的监测方案。该论文第一作者为计算机学院2022级博士生丁睿(导师为黄群助理教授),作者包括北京大学黄群、刘勋鹏、杨仕博,华为云谢宝树、孙蓉桦、张智和崔伯龙。

 

三、可拓展且近似最优的Sketch网络测量算子部署

descript

Sketch具备低资源开销和理论上的精度保证,因此是一类至关重要的网络测量算子。然而,在全网范围内部署Sketch却需要在部署最优性和可扩展性之间进行权衡:(1)大多数解决方案依赖混合整数线性规划(MILP)求解器获取最优部署决策,但它们耗时较长,难以扩展到大规模部署场景。(2)其它解决方案利用启发式算法提升了可扩展性,但引入了较高的网络资源和性能开销。论文“Eagle: Toward Scalable and Near-Optimal Network-Wide Sketch Deployment in Network Measurement”提出了一种可扩展且近似最优的全网Sketch部署框架。核心思想是将全网Sketch部署分解为多个子问题,从而(1)同时优化交换机资源开销和数据报处理的端到端性能,从而保证全网Sketch部署的近似最优性,且(2)将一系列用于加速问题求解的技术纳入子问题求解中,从而保证全网Sketch部署的可扩展性。与现有解决方案相比,Eagle在复杂网络拓扑环境下将Sketch部署加速了255倍,同时最小化Sketch部署的最优性损失。该论文第一作者为浙江大学计算机学院博士生陈翔(北京大学计算机学院访问学生),作者包括北京大学计算机学院黄群助理教授、浙江大学计算机学院吴春明教授和任奎教授等。

 

四、网络配置共享中的隐私匿名化保护

 

descript

 

现实世界中的真实网络配置在网络管理和科研中起着至关重要的作用。然而,由于商业和隐私方面的考虑,数据持有者通常不愿共享这些配置。现有的解决方案无法隐藏可从配置中隐式推断出的敏感信息,例如拓扑结构和路由路径。论文“ConfMask: Enabling Privacy-Preserving Configuration Sharing via Anonymization”提出了系统化地对网络拓扑和路由路径进行匿名化的新型框架ConfMask。我们根据网络配置推断出敏感数据拓扑图和路由表,通过图匿名化算法和常用路由协议对配置文件进行修改。ConfMask匿名化算法可扩展到大型网络,并有效地降低了算法被反向去匿名化的风险。此外,ConfMask维持了原有的网络属性,如可达性、路由点和多路径一致性,使其适用于广泛的下游任务。与现有的数据面匿名化算法NetHide相比,ConfMask可减少约75%匿名化前后的网络之间网络配置规则的差异。该论文第一作者为计算机学院2024级博士生王玥洁(导师为刘古月助理教授),作者包括北京大学计算机学院刘古月助理教授,上海纽约大学门秋彤,萧尧和陈泳廷。

 

五、基于双回路的数据中心传输控制协议

descript

 

随着链路速度不断增长,人们提出了许多数据中心网络传输协议来为应用提供低延迟。然而现有方案要么从小的初始窗口开始,迭代地收敛导致网络利用率不足;要么虽然有较好的性能但需要对现有的协议栈和应用程序进行重大修改导致难以实际部署。针对此问题,论文“PPT: A Pragmatic Transport for Datacenters” 提出一种实用数据中心传输方案PPT,旨在保留DCTCP的可部署性优势,同时有效地利用空闲带宽来最小化流完成时间(Flow Completion Time, FCT)。PPT通过双回路速率控制算法动态识别和填充空闲带宽,在不损害高优先级控制回路的情况下发送足够的数据包以提高性能。与此同时,通过缓冲区感知的流调度机制保证小流可以绕过队列中的大流,同时保证了高优先级控制回路性能不会受到低优先级控制回路的损害。相比于先进的主动传输方案,PPT降低了46.3%的平均FCT,甚至在Memcached负载中小流的平均/FCT降低了25%/55.5%。该论文第一作者为天津大学索栗德、庞义人,作者包括天津大学李文信教授和李克秋教授、北京大学计算机学院助理教授刘古月等。

 

 

延伸阅读:

38ACM数据通信专业组年度旗舰会议SIGCOMM 202438th Annual Conference of the ACM Special Interest Group on Data Communication)将于84—8日在澳大利亚悉尼举行。一年一度的ACM SIGCOMM重点关注计算机和数据通信网络领域,涵盖网络架构、设计、实现、运维、分析、度量和仿真等方面。SIGCOMM是计算机网络系统领域最权威的国际顶级学术会议之一,是CCF推荐的A类国际会议,每年吸引大量全球顶级学校和机构的投稿。