计算机所师生参加CVPR 2019

2019年6月16日至20日,第32届IEEE国际计算机视觉与模式识别会议CVPR-2019 (IEEE Conference on Computer Vision and Pattern Recognition)在美国长滩召开,计算机所肖建国老师、穆亚东老师、刘家瑛老师、研究生杨帅、宋思捷、实习生汪文靖等同学参加了此次会议。

CVPR是由IEEE举办的计算机视觉和模式识别领域的顶级会议,每年召开一次,主要探讨计算机视觉与模式识别技术的突破和发展,受到了国际学术界和工业界的广泛关注。会议内容涉及底层视觉算法、物体检测、识别与跟踪、人体理解与行人再识别、三维场景理解与分析、深度生成式模型、视频与行为理解等多个研究领域。本次会议包含Workshop、Tutorial、口头报告、海报展示等多个环节。

计算机所共有7篇论文被本次会议录用,并在会议上做了口头报告和海报展示,论文的具体信息如下:

Sijie Song, Wei Zhang, Jiaying Liu, Tao Mei. Unsupervised Person Image Generation with Semantic Parsing Transformation

论文针对人体姿态引导的图像生成任务中,输入图像和输出图像之间存在的空间非对应和非刚性变换问题,提出了基于语义转换的无监督人物图像生成算法,以人体语义图为引导,完成目标姿态下的人体图像生成。一方面,语义图不包含纹理信息,简化了无监督下输入输出的形状映射关系学习;另一方面,人体语义的引导对保持衣物的原始属性(款式、纹理等)提供了先验知识。实验结果表明了论文算法的有效性。该论文被接收为口头报告论文。

宋思捷做口头报告

Yifang Men, Zhouhui Lian, Yingmin Tang, Jianguo Xiao. DynTypo: Example-based Dynamic Text Effects Transfer

本文基于传统纹理合成技术提出了一种全新的动态文本特效迁移方法,能够实现动态特效在不同文本之间的自动迁移,生成大量时序稳定、风格还原度高的逼真动态特效字。不同于之前动画风格化方法中逐帧进行风格迁移的处理流,将整个视频在三维空间上看作一个整体,通过提取关键帧及构建时空相干项将二维图像中的图像块拓展到时序维度成为时空块,随后结合时空相干项和文本引导项构建目标函数,采用改进的PatchMatch算法在目标函数的引导下对目标视频时空块在素材视频中进行最近邻匹配,从而实现目标动态纹理合成。通过大量实验充分验证了本文方法的有效性和优越性,以及其在其他应用域的潜在拓展能力。

论文海报展示

Junchao Zhang and Yuxin Peng. Object-aware Aggregation with Bidirectional Temporal Graph for Video Captioning

视频对象及其动态时序演化对于视频内容理解以及生成准确的文本描述至关重要;另外,视频表征学习也是影响文本描述准确性的重要因素。针对上述问题,本文提出了对象感知双向图方法。一方面提出了双向时序图模型,通过从正时序和逆时序两个方向建立互补的双向时序图,捕捉每个对象的动态时序轨迹;另一方面提出了对象感知聚合模型,通过卷积门限循环网络为每个视频对象进行局部特征聚合,学习具有辨识性的对象特征。进一步结合注意力机制指导解码模型生成能够描述对象时序演化过程的自然语言文本。本文方法在两个广泛使用的数据集上进行了验证,提高了视频描述生成的准确率。

论文海报展示

Chenchen Liu, Xinyu Weng, Yadong Mu. Recurrent Attentive Zooming for Joint Crowd Counting and Precise Localization

已有的基于密度图的密集人群计数方法存在预测人群分布于真实分布不一致的问题。该论文提出一种基于注意力机制的循环缩放网络,能够同时获得密集图像中的人群数目以及人群的精确定位。

论文海报展示

Wenhan Yang, Jiaying Liu, Jiashi Feng. Frame-Consistent Recurrent Video Deraining with Dual-Level Flow

雨天图像包含多种降质因素,造成复杂的视觉降质效果。该论文首先提出统一的雨天视频信号模型,同时对雨痕、雨雾、遮挡和雨雾流动等视觉效果进行建模。基于该模型生成的数据以及逆向推导得到的复原公式,进一步构建两阶段的深度网络,结合信号建模与数据驱动先验,实现图像级和视频级的去雨。同时,网络考虑了帧间不同粒度的光流约束,得到了帧间更一致的去雨结果。

论文海报展示

Wenjing Wang, Jiaying Liu, Shuai Yang, Zongming Guo. Typography with Decor: Intelligent Text Style Transfer

本文提出了首先通过提取装饰元素的遮罩,然后对基本文字特效进行风格迁移,最终基于元素分布与字形结构估计装饰元素的新位置的框架,有效解决了装饰特效字的风格迁移问题,并提出了一个只需要单样本的文字特效迁移学习方法。

论文海报展示

Chen Wei, Lingxi Xie, Xutong Ren, Yingda Xia, Chi Su, Jiaying Liu, Qi Tian, Alan L. Yuille. Iterative Reorganization with Weak Spatial Constraints:Solving Arbitrary Jigsaw Puzzles for Unsupervised Representation Learning

本文提出了基于空间上下文关系的自监督学习方法,改进自监督学习中拼图任务的处理方法,使网络能够处理任意拼图布局,并扩展到不同维度的数据类型中,从而更好地学习空间上下文提供的语义信息。

论文海报展示

此外,在本次大会上,刘家瑛老师团队协同University of Notre Dame, Texas A&M University,及中科院信工所共同举办主题为Bridging the Gap between Computational Photography and Visual Recognition的workshop,并组织了UG2+计算机视觉算法竞赛,提供了一系列恶劣环境下检测任务的性能对比测试,目的在于评估和探索当前最先进的图像处理算法在极端条件下对检测和识别等任务的精确性与鲁棒性。比赛吸引了国内外共260支队伍报名参赛,82支队伍最终参赛并提交了有效结果,最终决出6支获胜队伍。

UG2+ Workshop/竞赛组织者合影图

CLOSE

上一篇 下一篇