科研基地

新闻出版智能媒体技术重点实验室

实验室简介

新闻出版智能媒体技术重点实验室依托单位为北京大学,具体建设单位为北京大学王选计算机研究所,共建单位为方正阿帕比技术有限公司。实验室重点研究知识挖掘与服务、内容呈现与表达、数据管理与运营、版权保护与应用、高新技术跟踪与应用等新闻出版关键技术,切合新闻出版领域的未来发展方向,助推出版业创新体系建设,服务出版业高质量发展。

实验室主任由汤帜研究员担任,副主任由万小军研究员、穆亚东长聘副教授、张行功副教授担任。

实验室研究方向

新闻出版智能媒体技术重点实验室是跨领域综合性实验室,研究方向包括:

1.  知识挖掘与服务

针对现阶段新闻出版领域的中文知识库数据量小、质量不高、应用不够充分的现状,研究互联网知识挖掘方法,丰富知识库构建的渠道,改进知识库构建方法和质量,改进知识库更新机制,大幅度增加知识库的数据量,研发具备推理能力的智能服务,并将知识库应用于新闻出版业,构建行业知识库,探索和研发新型的知识服务模式,在知识服务方面探索建立相关技术标准。

2.  内容呈现与表达

2.1 字形计算技术

为了提高中文字库的生产效率以及满足移动阅读过程中产生的个性化需求,研究基于笔画部件拼接的中文字库快速制作与智能化辅助设计方法,基于深度学习的汉字书写风格描述与建模方法,大规模汉字字体流形的构建及其应用,纹理特效字库的辅助设计与自动生成等相关基础理论与关键技术。

2.2 影像增强重建技术

影像增强重建技术,以视觉内容的高效重建和分析为核心目标。针对新闻出版中的应用需求,研究结合语义信息的记忆力驱动自适应视频增强和基于鲁棒特征表示的视频增强与理解,构建多模态多任务数据集与增强理解统一框架。

3.  数据管理与运营

针对知识图谱、用户数据分析等应用需求,围绕大规模图数据的管理、分析与计算,解决在图数据复杂性及其高效图计算方面的关键理论问题和核心技术难点,提出并完善相关的理论模型、关键算法和计算架构。根据图计算相关理论和框架,构建面向硬件和分布式系统环境下的图计算系统,并应用在多个实际应用场景。

4.  版权保护与应用

面对复杂多样的多模式应用环境,利用人工智能、区块链等新型技术,重点研究新型版权保护与服务模式,突破多模式应用环境下轻量级版权保护、面向知识复用的版权保护和基于版权保护的高保真可逆信息隐藏等关键技术难题,解决新闻出版版权保护、侵权追踪或版权认证问题。

5.  高新技术跟踪与应用

5.1 计算机辅助自动写稿

针对机器智能新闻写作或辅助写作的应用需求,实现文本生成的语义一致性可控、文本多样性可控、标注规模可控,并研制同时支持缩写、扩写与改写的机器写作系统,推动文本生成技术的产学研用一体化发展。

5.2 文档版面对象与结构信息的智能化抽取

针对新闻出版中移动阅读、碎片化知识加工、知识内容的深度化检索等应用需求,提高文献检索查重的精准度和深度,为学术检索、学术不端行为检测引擎提供基础算法和关键系统,研究下一代基于文档识别的智能检索查重算法。

5.3 漫画内容的分析与理解

针对漫画移动阅读、漫画内容检索、漫画内容监管与版权保护等应用需求,重点开展漫画/绘本人物识别、页面图像检索方面的研究,并针对漫画内容监管、绘本阅读机器人相关应用研发相应的关键技术和系统原型。

5.4 视频传输技术

突破云游戏、短视频、增强现实等新型视频应用的瓶颈,适应5G技术的发展,提出网络内容分发系统的设计和优化方案;研发新的实时视频传输算法,集成于TCP或QUIC等传输层协议中,并在互联网、广电、电信、在线教育等领域得到应用。

6.  跨领域综合性应用开发

在关键技术研究的基础上,依据行业和用户的需求进行应用开发,研发专业内容知识聚合服务平台等多套应用系统,并将相关的系统在较大规模的出版机构及资源内容应用机构进行推广和服务,形成良好的示范效果。