杨帅、何相腾博士荣获2020年北京大学优秀博士学位论文奖

郭宗明研究员指导的2015级博士生杨帅的博士学位论文《图像风格化与字效生成技术研究》、彭宇新教授指导的2014级博士生何相腾的博士学位论文《辨识性特征学习及在细粒度分析中的应用》被评为2020年北京大学优秀博士学位论文,这是王选所第一次有两位博士生同时获得此殊荣。

杨帅同学的论文立足于经典的图像风格化范式,面向新风格与新模型的科学问题,建立艺术字生成的统一框架。在数据层面,研究了字效的统计先验,指导不同数据规模下的风格建模问题,构建数据集建立了字效迁移的基准,推动领域发展。在模型层面,优化了模型对多风格的支持,探索了字效的扩展、编辑和控制方式。在应用层面,采用统一框架解决了字效迁移、艺术字生成、图文设计和文字提取等问题。与同期论文工作相比, 因提出问题新颖,研究针对性强, 体现出较高水平,相关工作已发表至或接收在领域内顶级会议与期刊CVPR-2017, ACM MM-2018, ICCV-2019, AAAI-2019, TPAMI, TIP, TMM, CVIU等。

杨帅同学在博士期间,获得了校长奖学金、李惠荣奖学金、国睿奖学金、北京大学“网络新青年形象大使” 称号以及信息科学技术学院“学术十杰”“信科之星”等荣誉。

杨帅与导师郭宗明合影

何相腾同学的论文从减少标注成本、减少人工先验、提高辨识速度、提高语义关联四个方面展开辨识性特征学习研究,并分别应用于细粒度图像分类和细粒度跨媒体检索任务。在减少标注成本上,提出了基于对象-部件注意力模型的细粒度图像分类方法,仅使用图像级标注,不需要繁琐的对象级和部件级标注,大大降低应用成本。在减少人工先验上,提出了基于堆叠式深度强化学习的细粒度图像分类方法,避免了现有方法依赖人工先验所造成的可用性和可扩展性上的局限性。在提高辨识速度上,提出了基于弱监督快速辨识定位的细粒度图像分类方法,在提升分类准确率的同时,实现分类加速。在提高语义关联上,提出了基于细粒度分类的跨媒体检索方法,实现图像向跨媒体的扩展,分类向检索的扩展。建立了首个包含4种媒体类型(图像、文本、视频和音频)的细粒度跨媒体检索公开数据集和评测基准PKU FG-XMedia。

何相腾同学在博士期间,发表IEEE Trans.和CCF A类国际顶级论文10篇(第一作者9篇),包括IJCV、IEEE TIP、TCSVT、CVPR、ACM MM、IJCAI、AAAI,并接收CCF A类中文期刊1篇(第一作者)。2014年-2016年,连续3年作为团队成员,参加由美国国家标准技术局(NIST)举办的国际权威评测TRECVID的视频语义搜索比赛,均获第一名,参赛队伍包括IBM Watson研究中心、AT&T实验室、阿姆斯特丹大学、日本国立情报学研究所等国内外大学和研究机构。获得了北京市优秀毕业生、北京大学优秀毕业生、2018年百度奖学金、国家奖学金、校长奖学金、华为奖学金以及信息学院“学术十杰”等荣誉。

何相腾与导师彭宇新合影

CLOSE

上一篇 下一篇