投稿须知
  一、征文范围及内容
  本刊主要刊登材料科学与工程、机械工程与动力工程、化工与轻工、自动 ...

一种基于特征树的Web碎片信息抽取算法

作者: 向程冠 ; 熊世桓

关键词: Web Web碎片信息 DOM树 信息抽取 召回率

摘要:为进一步解决Web碎片信息所特有的随意性给信息抽取带来的困难,通过对Web碎片信息DOM树的结构特征和Web碎片信息的文本特征(如时间、作者、信息等)进行研究,发现将两者相结合能有效地进行Web碎片信息抽取,提出一种基于特征树的Web碎片信息抽取算法.以新浪微博、腾讯微博、搜狐微博等在内的100个信息分享平台作为实验对象,实验结果表明,该算法具有良好的性能,可以达到较高的召回率与查准率.


上一篇:某地铁车站深基坑变形规律数值模拟及优化
下一篇:城市车载Ad Hoc网络下改进的AODV协议

Copyright 2007 Weihai China All Rights Reserved 兰州理工大学学报版权
鲁ICP备05001812号 
地址:甘肃省兰州市兰工坪路287号(730050)