王选所学生参加EMNLP 2024

EMNLP 2024(The 2024 Conference on Empirical Methods in Natural Language Processing)计划于2024年11月12日至11月16日在美国佛罗里达州迈阿密召开。EMNLP是自然语言处理领域顶级国际会议之一,CCF B类会议,其涉及领域包括但不限于机器翻译、文本生成、文本分类、信息抽取、问答系统、语言模型等研究方向。

北京大学王选计算机研究所语言计算与互联网挖掘实验室研究生高铭齐可参加了此次会议,展示了实验室的研究成果,并与国际同行进行了学术交流。

发表论文的具体信息如下:

Xinyu Hu, Li Lin, Mingqi Gao, Xunjian Yin, Xiaojun Wan. Themis: A Reference-free NLG Evaluation Language Model with Flexibility and Interpretability

自然语言生成(NLG)任务的评估是一个重要且长期存在的研究领域。随着近期强大大型语言模型(LLMs)的出现,一些研究转向了基于LLM的自动评估方法,这些方法展现出巨大潜力,有望成为继传统基于字符串和基于模型的指标之后的新评估范式。然而,尽管现有方法性能有所提升,它们仍存在一些不足,如依赖参考文本和评估灵活性有限。因此,在本文中,我们精心构建了一个大规模NLG评估语料库NLG-Eval,其中包含人类和GPT-4的注释,以缓解该领域相关数据的缺乏。此外,我们提出了Themis,一个专用于NLG评估的LLM,它通过我们设计的多视角一致性验证和面向评分的偏好对齐方法进行训练。Themis能够在无需参考文本的情况下进行灵活且可解释的评估,并在各种NLG任务上展现出优越的评估性能,同时能很好地泛化到未见过的任务,并超越包括GPT-4在内的其他评估模型。

高铭齐同学参加会议

高铭齐同学做海报展示

 

CLOSE

上一篇 下一篇