成果展示

好文分享:面向人民日报语料的新闻自动摘要生成

发布时间 : 2022年8月30日 18:00

  摘要:[目的/意义]面向主流新闻媒体人民日报语料展开研究,旨在为文本自动摘要研究提供思路和实践支撑,进而应用到新闻等相关文本信息处理中,为知识聚合服务和信息获取途径研究做出贡献。[方法/过程]以新时代人民日报语料NEPD中的2015年1月、2015年6月和2016年1月的人民日报分词语料作为实验语料,基于TF-IDF、Textrank等抽取式自动摘要算法,以及基于指针生成网络的生成式自动摘要模型展开研究,并对摘要结果进行分析评价。[结果/结论]实验设计面向人民日报语料的新闻抽取式自动摘要算法,构建面向人民日报语料的新闻生成式自动摘要指针生成网络模型,并通过Rouge指标(包括Rouge-1、Rouge-2和 Rouge-L 3种指标)对实验结果进行评测,为人民日报分词语料的应用提供具体思路,并对新闻自动摘要系统研究提供语料支持和实践支撑。 

 

  作者:梁媛,王东波,黄水清

  出处:知识管理论坛,2022,7(04):452-464

  关键词:人民日报;抽取式自动摘要;生成式自动摘要;NEPD;指针生成网络


南京农业大学人文与社会计算研究中心 领域知识关联研究中心 corpus.njau.edu.cn   苏ICP备11055736号-3苏
邮箱:corpus@njau.edu.cn  邮编:210095  地址:中国南京卫岗1号