王选所师生参加ACM MM 2019

2019年10月21日至25日,第27届ACM国际多媒体会议(The 27th ACM International Conference on Multimedia,简称ACM MM)在法国尼斯召开,王选所张行功老师、穆亚东老师、胡玮老师、和研究生孙笑、张晨睿参加了此次会议。

张行功老师(左)、胡玮老师(中)和穆亚东老师(右)在会场合影

ACM MM是由ACM举办的全球多媒体领域的顶级会议,一直以来受到国际学术界的广泛关注,每年召开一次,主要探讨计算机多媒体技术的突破和发展。

本次大会共有936篇论文提交,共录取248篇论文,录取率为26.5%。王选所师生共发表6篇论文,分别在会上做了口头报告和海报展示,信息如下:

[1] Chenrui Zhang, Xiaoqing Lyu and Zhi Tang, TGG: Transferable Graph Generation for Zero-shot and Few-shot Learning.

本文提出了一种统一解决零样本学习(Zero-Shot Learning, ZSL)、广义零样本学习(generalized ZSL)与小样本学习(Few-Shot Learning, FSL)的端到端框架。其中,可迁移图生成算法显式地建模类别概念、语义属性与视觉实例之间的关系,对偶标签传播算法实现对所建模关系的充分利用。在4个广泛使用的图像数据集上,该方法在以上三类任务中都获得了大幅度的性能提升,达到了当前的state-of-the-art。

张晨睿做论文口头报告

[2] Yu Guan, Xinggong Zhang and Zongming Guo, CACA: Learning-based Content-aware Cache Admission for Video Content in Edge Caching.

本文提出了一种基于内容特征的网络缓存算法。针对边缘缓存的计算资源和存储资源受限,缓存效率低问题,本方法提出一种分类缓存的准入策略,按照文件类别的热度进行缓存,而不是按文件热度。该方法改变了现有缓存机制,并采用树状学习和UCB决策,提高海量内容的缓存效率。

[3] Lu Chi, Guiyu Tian, Yadong Mu, Lingxi Xie, Qi Tian, Fast Non-Local Neural Networks with Spectral Residual Learning, ACM Multimedia 2019.

本文提出了一种基于具有全局可视野的新型神经网络。对于给定的神经网络输入,该网络通过基于频谱的“局部-全局”变换将输入转至频域,在频域定义一系列新的神经网络层,实现单一操作的全局影响。随后,通过“全局-局部”变换返回原始的数据域。该网络在大规模视频分类和人体姿态检测获得显著提升。

[4] Xiao Sun, Zhouhui Lian and Jianguo Xiao, SRINet: Learning Strictly Rotation-Invariant Representations for Point Cloud Classification and Segmentation.

本文提出了点投射特征来重构三维点云使得点云的深度表征具有严格旋转不变性,并提出了用于感知点云局部结构的图聚合算法,在点云分类及分割实验中达到SOTA。

孙笑做口头报告

[5] Xiang Gao, Wei Hu, Jiaxiang Tang, Jiaying Liu, and Zongming Guo, Optimized Skeleton-based Action Recognition via Sparsified Graph Regression.

本文提出了一种基于图回归的人体骨架动作识别模型。通过对人体骨架序列的时空建模,求解在连续帧上对图拉普拉斯矩阵建模的优化问题,最终得到最优的图拉普拉斯矩阵。然后,本文将优化得到的最优图结构同骨架序列的三维坐标输入GCN中,通过特征学习得到最终的分类结果。实验结果表明本文所提出的模型在大型的NTU RGB + D,UT-Kinect和SYSU 3D数据集上达到了state-of-the-art的结果。

胡玮老师在海报前做展示

[6] Xiangteng He, Yuxin Peng and Liu Xie, A New Benchmark and Approach for Fine-grained Cross-media Retrieval.

本文建立了第一个包含4种媒体类型(图像、文本、视频和音频)、涵盖200个类别的细粒度跨媒体检索公开数据集和评测基准PKU FG-XMedia。此外,提出了一种能够同时学习4种媒体统一表征的深度网络模型FGCrossNet,通过分类约束、中心约束和排序约束来学习统一表征以提升检索准确率。

CLOSE

上一篇 下一篇