计算机所师生参加EMNLP 2017

2017年9月7日-9月11日,2017年自然语言处理实证方法会议(Conference on Empirical Methods in Natural Language Processing,简称EMNLP)在丹麦哥本哈根召开,计算机所严睿老师,研究生姚丽丽,罗炳峰,曹俊杰,徐奎参加了此次会议。

计算机所师生在会场合影(左起:徐奎、曹俊杰、严睿、罗炳峰、姚丽丽)

EMNLP会议是自然语言处理领域的重要国际会议,一直受到国际学术界与工业界的广泛关注。这次会议包括了3个受邀演讲,15个工作研讨,7个任务教程以及3天的论文口头报告及海报展示,内容涵盖了语义分析、句法分析、信息抽取、对话系统、机器翻译等自然语言处理主流任务。

本届会议共收到有效投稿1466篇,录用文章323篇,其中长文216篇,短文107篇。计算机所师生在本次会议上共发表了4篇长文和1篇短文,分别针对词向量分析,自然语言应用,句法分析,文章生成,对话系统进行了研究,并在会议上做了口头报告和海报展示。论文具体信息如下:

[1]Kui Xu and Xiaojun Wan. Towards a Universal Sentiment Classifier in Multiple Languages.

该论文的目标是构建一个适用于多语言的情感分类器,为了实现该目标,提出基于英文情感标注语料与若干多语言平行语料来学习获得情感感知的多语言词向量表示,进而在统一语义空间中进行多语言情感分类。实验结果证实了构建面向多语言的统一情感分类器的可行性。

[2] Bingfeng Luo, Yansong Feng, Jianbo Xu, Xiang Zhang and Dongyan Zhao.Learning to Predict Charges for Criminal Cases with Legal Basis

提出了一种根据刑事案件的犯罪事实,同时判断输入案件所适合的罪名和法律条款的模型。本文发现利用相关法律条款可以明显提高罪名判断的效果,并且在利用裁判文书自动构建的数据集上训练的模型,在新闻语料上也能取得不错的效果。

[3] Junjie Cao, Sheng Huang, Weiwei Sun and Xiaojun Wan.Quasi-Second-Order Parsing for 1-Endpoint-Crossing, Pagenumber-2 Graphs

对于依存分析,在交叉边共享端点和双平面的约束下,提出了一种针对非交叉边提取高阶特征并进行精确解码的算法。该算法在保持原有算法复杂度的基础上下,在多个数据集上都比一阶结果有显著提升。

[4] Jianmin Zhang and Xiaojun Wan. Towards Automatic Construction of News Overview Articles by News Synthesis

对综述型新闻自动生成这一全新的问题进行探讨,并提出解决方案。该方法通过对面向同一事件的新闻段落重新分割,重要性排序,选择并且合并以及最后的重新排序,最终基于重组得到的新闻段落构建新闻综述。在WikiNews数据集上效果明显好于传统多文档摘要方法,有效节省人力物力。

[5] Lili Yao, Yaoyuan Zhang, Yansong Feng, Dongyan Zhao, Rui Yan. Towards Implicit Content-Introducing for Generative Short-Text Conversation Systems

常用的Seq2Seq的方法很容易产生比较通用的回复。在文本中,我们希望给定一个用户的问题,能够产生一个更有意义、更含有信息量的回复。因此,我们提出了一个隐式融合信息的方式:在Seq2seq模型中加入额外的信息,解码的过程中使用我们提出的层次型融合单元架构来融合上文信息和额外的信息。实验结果表明我们的方法在BLEU打分和人工打分中都优于基准方法,表明我们方法的有效性。

CLOSE

上一篇 下一篇