您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

情感词发现与极性权重自动计算算法研究

《中文信息学报》2017年 第3期 | 张华平 李恒训 李清敏   北京理工大学计算机学院 北京100081 北京市海量语言信息处理与云计算应用工程研究中心 北京100081 公安部第一研究所信安部 北京100048 工业和信息化部电子科学技术情报研究所 北京100040
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:随着互联网电子商务和各种社交网络应用的快速发展,产生了大量的用户评价信息。为满足快速整理这些评价信息的需求,情感倾向性分析应运而生。情感词典是各类情感倾向性识别算法的基础,收集一部全面且权重合理的情感词典,往往可以简单快速而有效地解决情感分析问题。但情感词典规模有限,而网络上新的情感词层出不穷,语言使用不规范,人工整理耗时耗力。已有的情感词收集方法较复杂,且领域性强,收集的情感词可扩展性差。本文提出一种自动挖掘潜在情感词并计算其极性权重的算法,该算法与应用领域无关,具有良好的扩展性。该方法利用共现特性,基于朴素贝叶斯公式能检测出未知的情感词,并根据其情感权重值的大小判断其情感极性,可有效地扩展情感词典,将已有的情感词典进一步量化。在理论研究的基础上,本文分别针对京东、豆瓣及大众点评网三组评论语料做了实验,其结果的准确率都基本在90%以上,验证了该方法的有效性和实用性,为情感倾向性分析提供了知识库基础。
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工)
【关键词】 情感词 情感权重 情感程度判别 情感词典
【出 处】 《中文信息学报》2017年 第3期 48-54页 共7页
【收 录】 中文科技期刊数据库