计算机所博士生张俊超和彭宇新教授的论文获MMM 2019最佳论文奖

2019年1月8日-11日,第25届多媒体建模国际会议(25th International Conference on Multimedia Modeling, MMM 2019)在希腊塞萨洛尼基举办,计算机所博士生张俊超和导师彭宇新教授的论文“Hierarchical Vision-Language Alignment for Video Captioning”获最佳论文奖(Best Paper Award)。

该论文针对视频的自动文本描述生成(Video Captioning)中视觉元素和语言成分的对齐问题,提出了分层的视觉-语言对齐方法,提取多层次的视觉-语言对齐信息以建模不同粒度的视觉元素和语言成分的对应关系,包括视觉对象-字词对齐、视觉关系-短语对齐、视觉区域-语句对齐;设计了注意力引导的编码器和对齐信息嵌入的解码器,综合利用多层次的视觉-语言对齐信息指导生成准确的视频文本描述语句。

wad

会议方为张俊超颁奖

MMM是多媒体领域的重要国际会议,自1993年以来已经举办了25届,旨在为学术研究人员和工程人员提供创新思想和学术交流的平台。MMM 2019共收到投稿论文204篇,它们来自中国、美国、英国、法国等的高校和科研机构,最终接收口头报告论文49篇,接收率24%。

wad

获奖证书

CLOSE

上一篇 下一篇