您的位置:网站首页 > 《中文科技期刊数据库》 > 人文社科 > 教育 > 中等教育 > 摘要

TValue术语抽取法

《情报学报》2013年 第11期 | 刘胜奇 朱东华   北京理工大学管理与经济学院 北京100081
在线阅读 ★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:提出TValue术语抽取法。为提高召回率,将词性固定搭配规则改为首尾词性规则。为提高准确率,设计首尾词性度、词长度;用中间最短母串修正母串对子串的影响,提出独立度;改进名词计分法为停用度;用语料中文档k外的文档集代替Weirdness的对比领域,提出重要度。基于三个假设:术语库具代表性、文档可交换、文档中术语可交换,构建了TValue术语抽取法。首先,基于首尾词性规则进行词串抽取。然后,计算词串的首尾词性度、词长度、独立度、停用度、重要度,以及五属性组合值TValue。最后识别TValue高于术语可信度的词串,来选择获选术语。能源行业的中文术语抽取实验结果表明,该方法可有效的抽取低频术语、非名词术语,准确率约为84.08%,召回率约为94.49%。
【分 类】【文化、科学、教育、体育】 > 中等教育 > 各科教学法、教学参考书 > 外语 > 英语
【关键词】 术语抽取 术语识别 能源行业 数据挖掘 技术监测
【出 处】 《情报学报》2013年 第11期 1164-1173页 共10页
【收 录】 中文科技期刊数据库