计算机所师生参加ICME2019

2019年7月8日至12日,国际多媒体及博览会议(International Conference on Multimedia and Expo,ICME2019)在中国上海召开,计算机所郭宗明老师、刘家瑛老师、胡玮老师、张行功老师、研究生王思薇、毕业生杨文瀚、潘婉琼、陈科吉等人参加了此次会议。

会场合影(左起:潘婉琼、胡玮、杨文瀚、郭宗明、陈科吉、王思薇)

本次会议吸引了来自学术界、工业界600多人参加,投稿1002篇,论文录取率为31%。会议包括了35个口头报告session和6个海报展示session、13个研讨会、3个特邀报告和9个学术课程。内容主要是多媒体信息处理,涉及视频编码、视频图像内容理解、网络传输等多媒体领域的各个方面。

在本次大会上,刘家瑛老师团队主办了主题为Intelligent Image Enhancement and Restoration - from Prior Driven Model to Advanced Deep Learning的讲习班,介绍了图像视频去雨、文字风格化、图像视频超分辨率以及低光照图像增强等领域的最新进展和团队在相关方向的工作,受到广泛关注。胡玮老师主持了3D and Low Level Vision口头汇报session并汇报了相关论文工作。计算机所师生在ICME2019上共发表了4篇论文,包括2篇口头汇报论文、1篇海报展示论文和1篇workshop论文。

论文具体信息如下:

[1] Fu Qiang, Wenhan Yang, Ying Li, and Jiaying Liu. Deep Pyramid Variation Learning For Image Interpolation.

本文提出了一种多尺度变化特征学习的图像插值方法。该方法学习到的特征表达讲图像被表示为高维特征:两个空间维度,一个邻域维度和一个尺度维度。之后,基于该特征表达,构建了一个可学习的循环多路径聚合网络。该网络迭代对特征进行精炼,每次迭代精炼都由一个多尺度多路径子网进行变换,从而更好地实现多尺度建模以及上下文信息推断,进行更好地图像插值。

[2] Junkun Qi, WeiHu, Zongming Guo. Feature Preserving And Uniformity-Controllable Point Cloud Simplification On Graph.

本文提出了一种点云简化的算法,不仅可以较好地识别并在简化的过程中保留点云所带有的几何特征,同时能够避免简化后的点云密度极度失衡,实现了特征保持与密度均一间的平衡。具体而言,论文利用图谱与图信号处理的理论,将不规则的点云表示在图数据结构上,并基于图滤波器提出了保持点云特征和密度均衡的优化方法。点云简化的问题最终被转换为权衡这两个因素的优化问题,并通过论文提出的近似和加速算法有效地解决。实验结果证明了该方法的优越性及其在点云配准中的有效应用。

胡玮老师做口头汇报

[3] Siwei Wang, Yongtao Wang, Xiaoran Qin, Qijie Zhao, Zhi Tang. Scene Text Recognition Via Gated Cascade Attention.

本文提出了一种级联式的注意力机制,来解决基于编码器-解码器场景文字识别模型中注意力的对齐问题,增强模型对不规则文本识别的鲁棒性。与其他论文比较,在多个公开自然场景文字识别数据集上取得了目前最好结果。

论文海报展示

[4] Weihong Lin, Xinggong Zhang, Zongming Guo, Wei Hu. OPV: Bias Correction Based Optimal Probabilistic Viewport-Adaptive Streaming For 360-Degree Video.

本文提出了视区演化感知的全景视频预取和更新的最优模型,该模型考虑了动态的视区变化,带宽的波动,以及视频的播放期限,从而来决定下载最优的视频片段。通过实验验证,本文提出的算法比传统的全景视频预取策略,能更好地消除视区预测偏差对全景视频的视区质量和播放抖动的影响。

CLOSE

上一篇 下一篇