2021年北京大学王选计算机研究所优秀毕业研究生评选结果

在王选所2021年优秀毕业研究生评选中,胡越予、李勇志同学荣获优秀硕士毕业论文奖,郑程元、黄一伦同学荣获优秀应用奖。

胡越予同学的论文深入研究了基于神经网络率失真优化的图像压缩技术,以深度神经网络和机器学习技术为技术突破口,分别针对帧内预测编码、端到端学习的图像压缩编码,以及人机协同的图像压缩编码等三个关键问题,提出了创新性的解决方法,并通过充分的实验验证了技术的有效性,获得了图像压缩编码率失真性能的显著提升。针对帧内预测问题,提出空间循环神经网络,提高了帧内预测的准确性,改进了编码性能;针对端到端图像压缩的信息熵估计的问题,提出了多粒度超先验模型,提升了图像端到端压缩技术中熵编码的准确率和效率,从而显著改进图像压缩率失真性能;针对新兴的人机协同视觉编码任务,针对人机协同图像压缩问题,提出了基于矢量化边缘图和生成模型的人机协同图像压缩技术,探索了人机协同视觉编码的可能性和深度学习在该任务上的潜力。胡越予同学与导师以及实验室同学紧密合作,发表及接收13篇学术论文,其中以第一作者身份发表期刊论文2篇,包括1篇IEEE TPAMI(影响因子17.861)和一篇IEEE TMM;以第一作者身份发表会议论文3篇,第一作者论文获IEEE ICME 2020最佳论文奖;申请国家专利4项,并参与IEEE 1857 FVC智能编码标准制定,1项技术提案被接收采纳。

胡越予同学和导师合影

李勇志同学在硕士期间主要研究基于复杂语义的图文匹配(image-text matching)问题,提出了一种基于图卷积的新模型。该模型将图像表达为基于关键物体的场景图(scene graph),同时将复杂文本查询语句解析为语法图,通过所提出的跨图卷积和注意力机制,有效提升了图文匹配任务在若干关键数据集上的性能。相关工作发表于计算机视觉领域顶级国际会议CVPR 2020。此外,针对现有的图文匹配方法的计算复杂度较高的问题,李勇志同学提出了一种新颖的图文哈希策略,首先通过短码筛除大部分与查询的关联性较弱的样本,继而通过长码进行精细排序,在计算效率和精度之间取得较好的权衡。李勇志同学在学期间共发表论文6篇,多次获得专项奖学金和三好学生等奖励。

李勇志同学和导师合影

郑程元同学在硕士期间研究了真实场景下的沉浸式视频实时传输问题,包括人眼感知质量驱动的虚拟现实视频传输,基于视区跟踪的16K虚拟现实视频传输和针对低延时、大带宽的实时拥塞控制算法。提出了一种新颖的虚拟现实视频感知质量评价模型,更加准确地刻画了用户在虚拟现实视频钟的感知质量;提出了一种基于视区跟踪的16K虚拟现实视频传输,有效降低了16K超高清虚拟现实视频的带宽和解码消耗;提出了一种针对实时沉浸式视频的拥塞控制算法,提升了实时沉浸实视频的交互质量,降低了交互延迟。参与研发《科技东奥》项目-虚拟现实观赛系统,将相关算法用于2022冬奥会的交互式观赛,并参与研究《媒体融合架构与编码传输》项目,将研发的低延时、大带宽拥塞控制算法落地于实际的低延时音视频传输。在张行功老师的指导下,郑程元同学硕士期间共发表学术论文3篇,其中以第一作者在国际顶级期刊TCSVT发表论文1篇,以第二作者在国际顶级会议SIGCOMM发表论文1篇,申请国家专利1项。

郑程元同学和导师合影

黄一伦同学在硕士期间研究了基于深度学习的文档表格检测优化与结构识别方法,提出了一种基于YOLO模型的表格检测优化方法,一种基于生成对抗网络的表格特征增强方法以及一种基于编解码器模型的表格结构识别方法。在国家数字复合出版系统工程中,参与研发的版面理解工具实现了三个粒度层级的文档版面理解功能,在若干国内大型出版社已进行了落地试点应用;在北京大学科研部的任务书识别系统中,负责研发的任务书信息提取工具提供了自动提取任务书中指定字段的功能,将项目申请信息填写过程从几分钟缩短至2-3秒,成功上线并已经提供了上千次服务调用。在高良才副教授的指导下,黄一伦同学共发表5篇学术论文,其中学生一作2篇,均发表于文档分析与识别领域的国际顶级会议ICDAR。

黄一伦同学和导师合影

 

附:优秀毕业研究生获得者及导师

学生姓名 论文题目 导师姓名 奖项
胡越予 基于神经网络率失真优化的图像压缩技术研究 刘家瑛 优秀硕士论文奖
李勇志 基于高阶语义建模的复杂图文匹配技术研究 穆亚东 优秀硕士论文奖
郑程元 沉浸式视频实时传输关键技术研究 张行功 优秀应用奖
黄一伦 基于深度学习的文档表格检测优化与结构识别方法研究 高良才 优秀应用奖

 

 

CLOSE

上一篇 下一篇