祝贺彭宇新教授当选电气电子工程师学会会士(IEEE Fellow)

发布时间:2025-12-02

2025年11月27日,电气电子工程师学会(IEEE)公布了2026年度晋升会士(Fellow)人员名单,北京大学彭宇新教授以其对跨媒体分析与细粒度识别的贡献(for contributions to cross-media analytical systems and fine-grained visual recognition),当选为IEEE Fellow。

彭宇新-A类资助.jpg

彭宇新,北京大学二级教授、博雅特聘教授,IEEE/CAAI/CIE/CSIG Fellow,2019年国家杰出青年科学基金获得者(2025年获延续资助),2019年国家万人计划科技创新领军人才,2018年科技部中青年科技创新领军人才,863项目首席专家,国家重点研发计划“社会治理与智慧社会科技支撑(平安中国)”重点专项总体专家组成员,中国工程院“人工智能2.0”规划专家委员会专家,中国人工智能产业创新联盟专家委员会主任,中国图象图形学学会副理事长,北京图象图形学学会副理事长。

主要研究方向为多媒体分析、计算机视觉、人工智能。以第一完成人获2016年北京市科学技术奖一等奖和2020年中国电子学会科技进步奖一等奖,2008年获北京大学宝钢奖教金优秀奖,2017年获北京大学教学优秀奖。主持了863、国家自然基金重点(2项)、北京自然基金联合基金重点、发改委专项等40多个项目。发表TPAMI、IJCV、CVPR、NeurIPS、ICML等ACM/IEEE Trans.和CCF A类论文160多篇,获最佳论文奖2次,包括国际多媒体领域的重要学术会议MMM 2019唯一最佳论文奖。连续4年(2021-2024)入选全球前2%顶尖科学家“年度科学影响力排行榜”和“终身科学影响力排行榜”。连续5年(2020-2024)入选爱思唯尔“中国高被引学者”榜单。入选ScholarGPS 2024年全球前0.05%顶尖学者近五年榜单。

参加10届(10年)由美国国家标准与技术研究院(NIST)举办的国际评测TRECVID视频搜索比赛,均获第一名,参赛队伍包括斯坦福大学、卡内基梅隆大学、牛津大学等。成果应用于国家网信办、公安部、国家广播电视总局等重要单位以及华为、腾讯、快手、蔚来、美团、中国电信、中国铁塔等头部企业。担任IEEE TCSVT高级领域编委、IEEE TMM等期刊编委,培养博士生获中国计算机学会、中国电子学会等优博。

彭2.jpg

彭宇新教授长期从事跨媒体分析研究,针对互联网大数据“管不住”和“用不好”两大难题,提出了跨媒体内容理解与生成的系统性解决方案。一是构建了“知识增强-粒度细化-运动感知”三位一体的跨媒体内容理解新范式,二是构建了“理解-推理-生成”闭环优化的跨媒体内容生成方法体系。提出了“弱监督图像细粒度分类”新研究方向,单篇论文谷歌引用1115次,被国际同行专家评价为“首次(first work)解决了无对象标注图像细粒度分类难题”、“取得巨大进展(made great progress)”。构建并发布了5个跨媒体数据集和评测基准,被斯坦福大学、麻省理工学院、卡内基梅隆大学、谷歌、微软等300多个研究机构使用,并发表TPAMI、IJCV、CVPR、NeurIPS等论文600多篇,引领跨媒体分析方向研究。

近年来彭宇新教授的研究成果应用于快手、华为、阿里、美团、蔚来、腾讯、中国电信、中国铁塔、中国航天科工三院等12家头部企业,代表性应用如下:

应用一:快手视频自动创作

文生视频技术应用于快手视频自动创作业务,克服内存消耗高、帧率低、连贯性差等难题,计算开销降低10倍,在画面质量、动态表现、响应速度等方面技术领先。

应用二:快手可灵AI试衣

虚拟换衣技术应用于快手可灵AI试衣业务,根据用户提供的人物照片和选择的商品图片,自动生成整体效果自然、细节高度保真的换衣效果图。

应用三:美团广告海报自动生成

广告海报自动生成技术应用于美团APP,以人工智能技术代替专业广告设计师,大幅降低人力成本,提高了广告海报的美学质量。

应用四:华为手机端侧大模型

端侧视觉大模型应用于华为手机图库APP,在提升大模型精度的同时显著降低参数量,提升了大模型在智能手机等端侧设备上的部署效率,增强了华为图库的智能化图像与视频处理能力。

应用五:阿里视频指纹识别

视频指纹识别技术应用于阿里云视频DNA检索系统,在视频查重、视频溯源等核心业务场景实现规模化应用,在提升检索准确率的同时,降低了5倍存储成本和25倍计算成本。

应用六:蔚来自动驾驶

三维场景感知技术应用于蔚来自动驾驶业务,达到厘米级场景流速度预测精度,实现了障碍物预测、移动目标追踪和密集三维场景感知等业务需求。

应用七:中国航天科工三院无人机控制系统

端侧障碍物感知技术应用于中国航天科工三院无人机控制系统,在端侧无人机设备上部署,仅仅使用视觉信息实现了无人机自主避障和自主降落,为无人机的低空飞行提供安全保障。应用八:腾讯视频推荐系统

跨媒体知识图谱技术应用于腾讯视频推荐业务,构建体育领域细粒度跨媒体知识图谱,并基于知识图谱预测用户偏好,实现大量视频的精准推荐。

应用九:腾讯视频内容审核

多模态内容审核大模型已应用于腾讯微信视频号,每日审核超过15万条用户上传内容,有害内容识别准确率超过98%。

应用十:中国电信人员跌倒检测

人员跌倒检测技术应用于中国电信天翼视联AI分析平台,实现学校、养老院等复杂场景中的实时在线多人跌倒检测。

应用十一:中国铁塔中高点位监测

中高点位多场景监测技术应用于中国铁塔视联平台,覆盖50种以上细粒度类别对象、4种模态(如可见光、夜视、红外等)监控场景,同时支持5种下游任务,精度和效率大幅提升。

欢迎交流合作:pengyuxin@pku.edu.cn


CLOSE