应用启发的大模型技术研究

报告题目: 应用启发的大模型技术研究

报告人:李俊涛

时间:11月21日(周二) 下午14:30—16:00

地点:王选所106会议室

摘要:ChatGPT发布一年以来,国内外相关团队对大模型全链路的数据构造、训练方法、效果调优进行了系统探索,为开源社区贡献了高质量的数据、模型,披露了重要的技术思路和细节。伴随着这样的进展,针对大模型的应用落地和技术研究也进入了新的阶段。本报告结合团队在大模型训练、应用落地、创新技术研究方面的经验,讨论大模型在实际应用中的使用范式和效用力,分享大模型应用优化、技术研究、人才培养等方面的思考。

报告人简介:李俊涛,苏州大学副教授(2020年至今),2020年博士毕业于北京大学王选所,主要研究文本生成和语言模型。入选第九届中国科协青年人才托举工程,入选2022年微软亚研“铸星计划”,CCF自然语言处理专委会执行委员,近5年发表CCF A/B论文45篇,出版FnTIR对话专著1部,在AAAI和IJCAI上做文本生成主题的Tutorial报告,主持参与横纵向项目10余项。作为项目带头人完成了苏大自研预训练大模型OpenBA的训练,并开发了多个变种版本,在多个场景得到了应用。

 

 

CLOSE

上一篇 下一篇