王选所机器智能实验室参加NeurIPS 2024

2024年7月21日至7月27日,神经信息处理系统大会(Neural Information Processing Systems, NeurIPS)于加拿大温哥华召开。王选所机器智能实验室的博士研究生孙至诚参加了此次会议。

 

NeurIPS是机器学习领域的国际顶级会议。本次会议吸引了来自学术界、工业界研究者们参加。会议包括受邀演讲、口头报告、poster展示、workshop等环节。本次大会共15671篇有效论文投稿,录取率为25.8%,录取数突破4000篇。王选所机器智能实验室师生在本次NeurIPS会议中总共发表两篇论文,以海报形式展示。接收的论文信息如下:

(一) Zhicheng Sun, Zhenhao Yang, Yang Jin, Haozhe Chi, Kun Xu, Kun Xu, Liwei Chen, Hao Jiang, Yang Song, Kun Gai, Yadong Mu, "RectifID: Personalizing Rectified Flow with Anchored Classifier Guidance", NeurIPS 2024

个性化扩散模型以生成身份一致的图像,具有很高的应用价值。现有的方法通常需要在大量特定领域的图像上进行训练才能实现身份一致性,缺乏灵活性。为了解决这个问题,我们利用一种无需训练的分类器引导技术来生成个性化图像。我们的研究表明,基于最新的rectified flow框架,分类器引导技术中需要特殊分类器的主要局限性可以通过简单的不动点求解得到解决,从而可以使用现成的图像判别器实现灵活的个性化。此外,我们证明当对采样轨迹进行约束时,该方法的求解过程具有收敛性保证。所提出的方法被应用在使用不同现成图像判别器的扩散模型上,在人脸、宠物等对象上取得了优异的个性化结果。

(二) Panwang Pan, Zhuo Su, Chenguo Lin, Zhen Fan, Yongjie Zhang, Zeming Li, Tingting Shen, Yadong Mu, Yebin Liu, “HumanSplat: Generalizable Single-Image Human Gaussian Splatting with Structure Priors”, NeurIPS 2024

人体重建技术在近年来取得了长足进步,但其对密集捕获图像和计算耗时的需求很高,极大地阻碍了在更广泛场景中的应用。为了解决这些问题,我们提出了 HumanSplat,它能从单个输入图像中以可泛化的方式预测任何人体的三维高斯拼接特性。具体而言,HumanSplat 包括一个二维多视角扩散模型和一个具有人体结构先验的隐表示重建模型,它们在一个统一的框架内巧妙地整合了几何先验和语义特征。为了实现高保真纹理建模和更好地约束估计的多视图,它还进一步设计了包含人类语义信息的分层损失。大量实验表明HumanSplat 在新视角合成任务上超越了现有的先进方法。

CLOSE

上一篇 下一篇