一种基于特征树的Web碎片信息抽取算法

作者: 向程冠 ; 熊世桓

关键词: Web Web碎片信息 DOM树信息抽取召回率

摘要：为进一步解决Web碎片信息所特有的随意性给信息抽取带来的困难,通过对Web碎片信息DOM树的结构特征和Web碎片信息的文本特征（如时间、作者、信息等）进行研究,发现将两者相结合能有效地进行Web碎片信息抽取,提出一种基于特征树的Web碎片信息抽取算法.以新浪微博、腾讯微博、搜狐微博等在内的100个信息分享平台作为实验对象,实验结果表明,该算法具有良好的性能,可以达到较高的召回率与查准率.

上一篇：某地铁车站深基坑变形规律数值模拟及优化
下一篇：城市车载Ad Hoc网络下改进的AODV协议

一种基于特征树的Web碎片信息抽取算法

作者: 向程冠 ; 熊世桓

关键词: Web Web碎片信息 DOM树 信息抽取 召回率

关键词: Web Web碎片信息 DOM树信息抽取召回率