- · 图书馆乐享数字资源主题活动[11/26]
- · 图书馆共享党员之家活动室启用[11/26]
- · 转发:教育系统“美好‘食’光””校园系列活动主题作品征集活动通知[11/03]
- · 红柳法学大讲堂第二十八期[11/03]
- · 关于举办兰州理工大学“红柳之星”2020校园新生才艺大赛的通知[10/30]
- · “科学家精神报告团”进校园活动通知[10/28]
- · 兰州理工大学2020年秋季学期国家普通话水平测试报名通知[10/27]
- · 2020年秋季学期至2021年寒假国内外线上线下交流项目报名通知[10/20]
基于词向量聚类的中文微博产品命名实体识别
作者: 王洪亮 石家庄职业技术学院 河北石家庄050081
关键词: 中文微博 命名实体 主题模型 神经网络 词向量
摘要:随着微博等社交平台的兴起,如何针对微博数据进行产品命名实体识别成为了自然语言处理领域研究的热点之一,也是实现舆情监督和商业智能的基础.传统的命名实体识别技术没有考虑中文微博口语化、不规范等特点,且忽略了深层语义对命名实体识别的重要作用.因此,考虑中文微博的特殊性,提出一种融合全局上下文信息的词向量特征选择方法,分别采用主题模型和神经网络词向量聚类两种方法获取深层语义信息,并结合层叠条件随机场进行中文微博的命名实体识别.实验结果表明,基于词向量聚类的中文微博产品命名实体识别方法取得了较好的效果.