基于图结构化模型库的神经网络模型推荐
报告题目:基于图结构化模型库的神经网络模型推荐
报告人:邸世民
时间:12月1日下午 14:00
地点:北京大学王选计算机研究所106报告厅
报告摘要:近年来,由于人工神经网络模型在各项任务上的卓越表现,其设计与迁移受到了广泛关注。然而,复杂多变的下游数据和庞大多样的模型空间给模型设计带来了严峻的挑战。无论是人类专家设计或是自动算法设计都面临两大主要难题:(1)在候选模型的反复试错中消耗大量计算资源,(2)需要复杂且漫长的过程来构建数据、模型、性能之间的关联。受当前研究人员在不同数据集上设计、训练并记录各种模型性能的启发,我们提出一种将基准数据转化为图结构化模型库KBG的框架,该模型库KBG主要以“性能(数据,模型)”这种结构化的方式存储神经网络模型设计知识,从而助力后续的模型迁移、设计与推荐。我们进一步将现有模型库KBG与大语言模型相结合,使大语言模型在模型设计过程中能够以类人的方式思考并检索现有的模型知识,再模拟人类专家设计并探索新模型的过程。大量实验表明,该框架能够高效地为未见数据集推荐具有潜力的初始模型建议,仅需数秒即可完成,从而大幅缩短模型架构设计的计算开销和开发周期,并且能在少量迭代次数内继续优化模型架构设计。
个人简介:邸世民,香港科技大学研究助理教授、华为资助青年教授,入选香港科学院青年科学家荣誉提名。他于2022年从香港科技大学取得计算机科学与工程博士学位后,同年开始担任博士后研究员,研究方向获香港赛马会资助并评选为STEM人才研究员。后于2023年起留校任教,担任研究助理教授。近年来,他在国家自然科学基金委和华为等项目的持续资助下,重点围绕图表征学习、知识图谱和自动化算法开展科学研究,以第一作者或通讯作者身份在SIGKDD、WWW、SIGMOD和NeurIPS等国际高水平刊物上累计发表论文20余篇。
上一篇 没有了