王选所学生参加ICASSP 2026
发布时间:2026-05-26
发布时间:2026-05-26
第51届声学、语音与信号处理国际会议(ICASSP 2026)于2026年5月4日至8日在西班牙巴塞罗那国际会议中心举行。作为IEEE信号处理学会(SPS)的旗舰会议,会议汇聚了全球超过4,000名研究人员与从业者,议程涵盖了从语音、图像到机器学习与生物医学等前沿领域的4,500余场同行评审报告。通过丰富的行业项目、职业发展工作坊及卫星研讨会,ICASSP 2026持续推动着学术创新与产业应用的深度融合。

王选计算机研究所文档智能课题组硕士生胡行健参加了ICASSP会议并完成海报展示。发表论文为:
HU, XINGJIAN and YAN, ZUOYU and ZHU, JIANHUA and GAO, LIANGCAI and WANG, FEI and MA, TENGFEI Graphpl: Leveraging GNN for Efficient and Robust Modalities Imputation in Patchwork Learning.
在分布式多模态拼接学习(patchwork learning)场景下各客户端可观测模态彼此不同的背景下,针对现有 POE 类方法普遍存在过度依赖部分模态、出现模态坍塌的问题,本文提出了一种基于图神经网络的模态融合框架 GraphPL,能够自适应整合所有可观测模态,并在高效融合的同时显著提升填补质量与噪声鲁棒性。具体而言,GraphPL 通过基于 GNN 的模态融合模块,在模态—模态完全图上以消息传递的方式实现跨模态自适应融合,从机制上缓解 POE 融合带来的模态坍塌;在训练阶段,每轮在客户端上随机选择一个观测模态作为目标模态进行掩码,以其余观测模态作为条件模态,通过直接建模条件似然的填补任务与单模态重构任务联合优化,并结合 FedAvg 在隐私约束下完成跨客户端的编码器、解码器与 GNN 参数协同更新;在推理阶段,GNN 模块输出的缺失模态特征既可送入解码器完成模态填补任务,也可与观测模态特征拼接用于下游预测任务,兼顾填补与下游两类目标。实验结果表明,GraphPL 在 PolyMNIST、MST、Quad-CelebA 上生成质量分别提升 8.8%、13.9% 与 4.8%,在真实 EHR 数据集 eICU 的疾病诊断、药物推荐、治疗推荐任务上分别提升 11.5%、6.5% 与 8.0%,并在噪声扰动下显著优于过往主流方法。

王选计算机研究所深度视频研究室博士生陈悦迪在参会期间,通过口头报告与海报展示方式与全球研究者分享了发表在ICASSP 2026的4篇论文,内容涵盖深度视频编码、时间序列预测和建模等方面。
|
|

深度视频研究室博士生陈悦迪、陈润恺、孙天翊在孙俊教授指导下,以第一作者身份在ICASSP 2026共计发表4篇论文:
[1] Y. Chen, R. Chen, Y. Wang, T. Sun and J. Sun, "DJ-Norm: A Decomposition-Based Joint Normalization Framework for Non-Stationary Time Series Forecasting," ICASSP 2026
[2] R. Chen, Y. Chen, X. Guo, Y. Wang, T. Sun and J. Sun, "FAITH: Enhancing Time Series Forecasting With Frequency-Based Adaptive Input Horizon," ICASSP 2026
[3] T. Sun, Y. Wang, Y. Chen, R. Chen and J. Sun, "Optimized Partitioning Acceleration for VVC Inter Coding," ICASSP 2026
[4] T. Sun, Y. Wang, R. Chen, Y. Chen and J. Sun, "BHSFlow: Low-Latency Flow Estimation with Block-Wise Huber Loss and Simplified Structure," ICASSP 2026


