应用启发的大模型技术研究

报告题目: 应用启发的大模型技术研究

报告人：李俊涛

时间：11月21日（周二）下午14:30—16:00

地点：王选所106会议室

摘要：ChatGPT发布一年以来，国内外相关团队对大模型全链路的数据构造、训练方法、效果调优进行了系统探索，为开源社区贡献了高质量的数据、模型，披露了重要的技术思路和细节。伴随着这样的进展，针对大模型的应用落地和技术研究也进入了新的阶段。本报告结合团队在大模型训练、应用落地、创新技术研究方面的经验，讨论大模型在实际应用中的使用范式和效用力，分享大模型应用优化、技术研究、人才培养等方面的思考。

报告人简介：李俊涛，苏州大学副教授（2020年至今），2020年博士毕业于北京大学王选所，主要研究文本生成和语言模型。入选第九届中国科协青年人才托举工程，入选2022年微软亚研“铸星计划”，CCF自然语言处理专委会执行委员，近5年发表CCF A/B论文45篇，出版FnTIR对话专著1部，在AAAI和IJCAI上做文本生成主题的Tutorial报告，主持参与横纵向项目10余项。作为项目带头人完成了苏大自研预训练大模型OpenBA的训练，并开发了多个变种版本，在多个场景得到了应用。