您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 电子电信 > 通信 > 摘要

维基百科的中文语义相关词获取及相关度分析计算

《北京邮电大学学报》2009年 第3期 | 李赟 黄开妍 任福继 钟义信   北京邮电大学计算机学院 北京100876 德岛大学先端技术科学教育部 日本德岛7708502
在线阅读 ★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:为了研究在线百科全书维基百科在语义相关词抽取、语义相关度计算等方面的应用,从中文维基百科下载并整理了5万余篇解释页面文档,抽取了反映语义关系的站内超级链接网络,通过挖掘文档间相互引用的链接关系抽取了近40万对语义相关词,并研究了语义相关词之间的主题聚类特性,选择两两相关的多个词得到相关词集合并计算了平均语义相关度.相关度计算综合利用了链接在文档中的位置、频率等信息,通过对比经典算法在同一测试集上的计算结果对算法进行了分析评估,证明了维基百科语义相关词抽取方法的有效性.
【分 类】【工业技术】 > 无线电电子学、电信技术 > 通信 > 通信理论 > 信息论 > 信道编码理论
【关键词】 维基百科 语义关系 语义相关度
【出 处】 《北京邮电大学学报》2009年 第3期 109-112页 共4页
【收 录】 中文科技期刊数据库