北京大学王选计算机研究所IGCL实验室成员参加SIGGRAPHAsia2024

2024年12月3日至12月6日,第17届SIGGRAPHAsia2024在日本东京举行。本届大会以“Curious Minds”为主题,展现了3D生成技术与具身智能领域的前沿趋势。参与人数和论文投稿数量均创历史新高。

SIGGRAPHAsia2024主会场

北京大学王选计算机研究所IGCL实验室发表的《HFH-Font: Few-shot Chinese Font Synthesis with Higher Quality, Faster Speed, and Higher Resolution》与《Pano2Room: Novel View Synthesis from a Single Indoor Panorama》两片文章被本届SIGGRAPHAsia录用,其中HFH-Font被录用为TOG文章。

实验室硕士生李华作口头报告展示

会上,实验室硕士生李华为文章《HFH-Font: Few-shot Chinese Font Synthesis with Higher Quality, Faster Speed, and Higher Resolution》作口头报告。目前,自动合成高质量矢量字体的挑战,特别是对于包含大量复杂字形的书写系统(例如中文),仍未解决。现有的字体合成技术分为两类:1)直接生成矢量字形的方法,2)先合成字形图像然后将其矢量化的方法。然而,第一类方法通常无法构建完整且正确的复杂字形形状,而后一类方法则难以在保留局部细节的同时高效合成高分辨率(即1024 × 1024或更高)的字形图像。该文章介绍了一种名为HFH-Font的少样本字体合成方法,该方法能够高效生成可转换为高质量矢量字形的高分辨率字形图像。具体来说,该方法采用基于扩散模型的生成框架,并结合组件感知条件来学习适应不同输入参考大小的不同层次的风格信息。该文章还设计了一个基于Score Distillation Sampling的蒸馏模块,用于一步快速推理,以及一个风格引导的超分辨率模块,用于优化和放大低分辨率的合成结果。该文章进行了广泛的实验,包括与专业字体设计师的用户研究,结果表明该方法显著优于现有的字体合成方法。实验结果显示,该方法能够生成高保真、高分辨率的光栅图像,这些图像可以矢量化为高质量的矢量字体。使用该方法,首次可以自动生成与专业字体设计师手工创建的质量相媲美的大规模中文矢量字体。

HFH-Font整体效果展示

 

实验室博士生浦果作口头报告展示

另一边,实验室博士生浦果为文章《Pano2Room: Novel View Synthesis from a Single Indoor Panorama》作口头报告。通过利用从大量3D对象数据集中提取的知识,最近的单视图3D生成方法取得了显著进展。然而,由于现实环境的复杂性和高质量先验资源的有限性,从单视图合成3D场景仍然面临挑战。该文章介绍了一种名为Pano2Room的新方法,旨在从单个全景图像自动重建高质量的3D室内场景。这些全景图像可以使用全景RGBD修补器从任意相机在单个位置捕获的图像轻松生成。关键思路是首先从输入的全景图像构建初步网格,并使用全景RGBD修补器迭代优化该网格,同时收集逼真的3D一致伪新视图。最后,将优化后的网格转换为3DGS场,并使用收集的伪新视图进行训练。该流程能够在存在大量遮挡的情况下重建现实世界的3D场景,并促进具有详细几何结构的逼真新视图的合成。该文章进行了广泛的定性和定量实验,以验证该方法在单全景室内新视图合成方面相对于最先进方法的优越性。

Pano2Room主体框架

IGCL参会师生在会场合照

通过参加SIGGRAPHAsia 2024,学生不仅了解了计算机图像学领域的前沿研究成果,还在与业内人士的互动中掌握了实践中的需求和挑战,为实验室成员带来了许多宝贵的灵感和思路。

 

CLOSE

上一篇 下一篇