王选所师生参加ICDAR2019
2019年9月20日至25日,国际文档分析与识别会议(International Conference on Document Analysis and Recognition, ICDAR2019)在澳大利亚悉尼召开,王选所连宙辉老师,研究生王逸之、黄一伦参加了此次会议。
ICDAR由国际模式识别学会(IAPR)组织,每两年召开一次,是文档分析与识别领域公认最重要的国际学术会议。本次会议共收到403篇论文投稿,共有52篇被录用为oral论文,176篇被录用为poster论文。
本届会议包含3个主题演讲报告、录用论文的口头报告与海报展示、9个workshop,5个tutorial演讲、以及IJDAR(International Journal on Document Analysis and Recognition)特刊论文的口头报告。参会者们介绍了自己在手写文字识别,文档图像处理、文档理解、表格分析、文本定位与识别等领域的最新成果。ICDAR在此前举行的18个技术竞赛在模式识别、计算机视觉领域具有重要影响力,受到了科研院校、科技公司的广泛参与和关注。
王选所师生在会场合影(左起:王逸之,连宙辉,黄一伦)
高良才老师小组与法国Naver Labs Europe、奥地利Computer Vision Lab、德国Archiv des Bistums Passau以及中国方正数字出版技术国家重点实验室共同举办了表格检测与识别竞赛ICDAR2019 Competition on Table Detection and Recognition(http://sac.founderit.com/),吸引了来自不同国家和地区的十一支队伍报名参赛,其中竞赛数据集包括手写的历史文档和现代的电子文档两部分,涵盖表格位置检测和表格结构识别两个任务,共有超过2500张人工标注文档页面图像。
王选所师生在ICDAR2019上发表两篇poster论文和一篇IJDAR特刊论文。论文的具体信息如下:
[1] Yibo Li, Qinqin Yan, Yilun Huang, Liangcai Gao, Zhi Tang. A GAN-based Feature Generator for Table Detection.
本文使用GAN来得到一个新的特征生成器,使得它对表格中的文本布局特征而非表格线条特征更加关注,从而提高对少线表、无线表的检测效果,该特征可以作为新的特征通道添加到已有的检测模型中,通过实验也验证了该特征对表格检测结果具有不小的提升。
[2] Yilun Huang, Qinqin Yan, Yibo Li, Yifan Chen, Xiong Wang, Liangcai Gao, Zhi Tang. A YOLO-based Table Detection Method.
本文提出了一种基于YOLOv3的表格检测方法,在此基础上针对表格特有的特征对模型以及anchor进行了特有的适应性优化,并提出了若干种有效的后处理方法,该方法在几个数据集上得到了state-of-the-art的实验效果。
黄一伦做海报展示
[3] Yizhi Wang, Zhouhui Lian, Yingmin Tang, Jianguo Xiao. Boosting Scene Character Recognition by Learning Canonical Forms of Glyphs.
该工作为IJDAR特刊论文,受邀在ICDAR2019上进行口头报告。本文设计了一种识别自然场景字符图片的模型Character Transform and Recognition Network (CTRN), 该网络模型可将自然场景文字图片变换为多种字体的标准形态图片,相比于传统的神经网络分类模型,该网络可以抽取出具备场景无关和字体无关性质的特征,有利于提升字符类别的识别精度。
王逸之做口头报告
上一篇 下一篇