投稿须知
  一、征文范围及内容
  本刊主要刊登材料科学与工程、机械工程与动力工程、化工与轻工、自动 ...

基于不同语料的词向量对比分析

作者: 崔萌 张春云    滨州医学院网络信息中心 山东烟台256603 山东财经大学计算机科学与技术学院 山东济南250014

关键词: 表示学习 词向量 相似性比较

摘要:通过对目前自然语言处理领域中基于深度学习的词向量表示方法对不同文本语料文本表达的有效性进行分 析,将主流词向量训练方法用于不同的文本语料集,包栝英文维基百科语料、新闻语料、论坛语料和Web 语料进行 训练,并采用三种评价指标:余弦相似度平均差、斯皮尔曼等级相关和米克罗夫类比方法对训练出的文本词向量表 达方法进行比较.实验结果表明,针对上述四种语料,词向量能够实现对文本的有效表示,但各个语料训练出的词向量的通用性不同,其中维基百科语料训练的词向量的通用效果最好.


上一篇:不同试验方法下微型抗拔桩的受力特性对比分析
下一篇:基于信息功率谱的微博热点挖掘模型

Copyright 2007 Weihai China All Rights Reserved 兰州理工大学学报版权
鲁ICP备05001812号 
地址:甘肃省兰州市兰工坪路287号(730050)