多模态内容生成:掀起未来创意无限可能

报告题目:多模态内容生成:掀起未来创意无限可能

报告主讲:潘滢炜 博士  HiDream.ai(智象未来)

时间:2024年9月25日(周三)上午10:00-12:00

地点:北京大学 二教 211教室

报告摘要

多模态内容生成技术已经带来人工智能全新的应用场景, 一方面, 可以赋能内容生产降本增效, 在影视、医疗、教育、广告营销等相关领域为用户带来颠覆式的创新体验;另一方面, 通过打造多模态AI原生应用, 进一步拓展软硬件产品的商业价值。因此, 多模态内容生成技术有望掀起新一轮产业革命, 而多模态大模型也是通往通用人工智能的必经之路, 必将产生巨大的行业生态。在本次报告中, 我们将介绍图像、视频、3D等多模态内容生成方向的技术前沿和应用实践, 还将介绍如何应用多模态内容生成的创新技术赋能视觉艺术设计、产品营销、影视制作等领域的实际产品和案例。

讲者简介

潘滢炜, HiDream.ai技术总监, 研究方向为多媒体内容理解和生成。在国际学术会议和期刊上已发表高水平学术论文60余篇, 谷歌学术引用约9000次 (h-index: 39)。成果多次成功转化到智象视觉多模态基础模型、十亿级商品图像搜索引擎(京东拍照购)、体育赛事智能导播系统等多项产品和服务, 并在视觉内容分析和理解的国际学术竞赛中6次获得冠军。曾获微软学者奖学金 (2015), ACM SIGMM China 最佳博士论文奖 (2019) 和新星奖 (2022), ACM Multimedia 最佳开源项目奖 (2021), 多媒体领域旗舰期刊 (ACM TOMM) 2022年度最佳论文奖、2022年度中国图象图形学学会科技进步奖一等奖。

CLOSE

上一篇 没有了