投稿须知
  一、征文范围及内容
  本刊主要刊登材料科学与工程、机械工程与动力工程、化工与轻工、自动 ...

多文档文摘提取方法的研究

作者: 张其文 ; 李明

关键词: 自动文摘 文本分段 语义段 向量空间模型 文本模型 automatic abstracting text segmentation semantic paragraph vector space model text model

摘要: 在深入分析当前流行的自动文摘技术和方法的基础上,将语义方法融入统计算法,提出了一种基于统计的多文档文摘提取方法,描述了它的实现过程.该方法利用文档内和文档之间段落的语义相关性,实现了多文档文摘的自动生成.首先对文档进行分段实现信息分割,再利用聚类技术对文本段进行聚类实现信息合并,最后从类中抽取代表段产生摘要文本.实验结果表明,该方法是一个有效、实用的方法.


上一篇:使用增量SVM进行文本分类
下一篇:机群系统的可用性分析计算

Copyright 2007 Weihai China All Rights Reserved 兰州理工大学学报版权
鲁ICP备05001812号 
地址:甘肃省兰州市兰工坪路287号(730050)