计算机所师生参加ACM MM 2018
2018年10月22日至26日,第26届ACM国际多媒体会议(the 26th ACM International Conference on Multimedia)在韩国首尔召开,计算机所郭宗明老师、张行功老师、胡玮老师和8名研究生参加了此次会议。
计算机所师生在ACM MM会场合影(左起:何相腾、叶钊达、袁明宽、綦金玮、郭宗明老师、胡玮老师、谢澜、张行功老师、刘利欣)
ACM MM是由ACM举办的全球多媒体领域的顶级会议,一直以来受到了国际学术界的广泛关注,每年召开一次,主要探讨计算机多媒体技术的突破和发展。本次大会共有757 篇论文提交,共录取64篇oral paper(录取率为8.5%),144篇poster paper(录取率为27.5%)。
计算机所师生在ACM MM 2018会议上共发表了5篇Oral Paper、1篇Brave New Ideas Paper,3篇Poster Paper,分别针对跨媒体检索、图像细分类、文本生成图像、图像生成诗歌、文字风格化、360度视频传输、漫画分镜和点云分割等进行了研究,并做了口头报告和海报展示。
论文信息如下:
[1] Xiangteng He and Yuxin Peng. "Only Learn One Sample: Fine-Grained Visual Categorization with One Sample Training" (Oral)
本文提出了一种基于选择和生成的数据增广方法,通过数据分割、数据过滤、数据再选择和数据生成实现一个训练样本的数据扩充,进而实现一个训练样本条件下的图像细分类。
[2] Mingkuan Yuan and Yuxin Peng. "Text-to-image Synthesis via Symmetrical Distillation Networks" (Oral)
本文提出了一种基于对称蒸馏网络的文本到图像生成方法,将通用判别模型的知识迁移到文本生成图像模型中,自动生成在内容上符合文本描述的图像。
[3] Jinwei Qi, Yuxin Peng and Yunkan Zhuo. "Life-long Cross-media Correlation Learning"(Oral)
本文提出了跨媒体终身学习方法,通过域内的分布对齐和域间的知识蒸馏,在充分保留原有数据关联效果的同时,利用知识迁移促进新增数据的关联学习,实现跨媒体检索
[4] Lan Xie, Xinggong Zhang, Zongming Guo."CLS: A Cross-user Learning based System for Improving QoE in 360-degree Video Adaptive Streaming"(Oral)
本文提出了一种基于跨用户学习的360度视点自适应传输方法,能够提高视点预测的准确率,从而提高用户观看到的360度视频质量。
[5] Shuai Yang, Jiaying Liu, Wenhan Yang, and Zongming Guo. "Context-Aware Unsupervised Text Stylization" (Oral)
本文提出一种无监督的文字风格化及图文结合方法,能够根据纹理图片合成艺术字,并无缝嵌入到背景图像中,设计图文结合的艺术作品。
[6] Lixin Liu, Xiaojun Wan and Zongming Guo. "Images2Poem: Generating Chinese Poetry from Image Streams" (Brave new idea paper)
本文研究用计算机从图像集生成古诗的问题。提出了一种基于选择机制和自适应自注意力机制的方法,能够根据一系列图像作出符合规范和场景的古诗。
[7] Zhaoda Ye and Yuxin Peng. "Multi-Scale Correlation for Sequential Cross-modal Hashing Learning" (Poster)
本文提出一种基于多种尺度特征间关联挖掘的跨媒体哈希方法,通过循环神经网络共享多种尺度特征的互补信息,并挖掘不同模态多种尺度特征间的关联信息促进哈希函数的学习,提高跨媒体哈希快速检索的准确率。
[8] Zheqi He, Yafeng Zhou, Yongtao Wang, Siwei Wang, Xiaoqing Lu, Zhi Tang, and Ling Cai. "An End-to-End Quadrilateral Regression Network for Comic Panel Extraction". (Poster)
本文提出了一种新颖的四边形漫画分镜回归方法,在全新的回归目标、损失函数和网络结构下,神经网络的识别速度超过了基于规则的方法,并且分镜识别准确率和页面准确率得到了极大提升。
[9] Gusi Te, Wei Hu, Amin Zheng, Zongming Guo. "RGCNN: Regularized Graph CNN for Point Cloud Segmentation". (Poster)
本文提出了基于图卷积网络的点云分割方法,能够高效率地对点云进行分割和分类,同时达到了优秀的鲁棒性和较低地复杂度。
上一篇 下一篇