您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 自动化理论 > 摘要

Web文本中维吾尔语领域术语的自动发现

《计算机应用》2012年 第2期 | 钟军 田生伟 禹龙   新疆大学信息科学与工程学院 乌鲁木齐830046 新疆大学软件学院 乌鲁木齐830046 新疆大学网络中心 乌鲁木齐830046
★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
  • 第4页
论文服务:
摘 要:针对维吾尔语领域术语获取难度大,人工扩充领域术语工作量大、效率低等特点,利用词汇共现原理,以维吾尔语连接词和互信息(MI)为工具,快速扩充原始维吾尔语领域术语;建立了以维吾尔语领域术语为特征模板,利用条件随机场(CRF)模型实现web文本中维吾尔语领域术语的自动发现方法,并在此基础上实现长维吾尔语领域术语的自动发现。实验表明,对短维吾尔语领域术语的自动发现准确率为97.59%,召回率为93.38%,对长维吾尔语领域术语的自动发现正确率达到55.72%。
【分 类】【工业技术】 > 自动化技术、计算机技术 > 自动化基础理论 > 人工智能理论 > 自动推理、机器学习
【关键词】 维吾尔语 互信息 条件随机场 TF/IDF
【出 处】 《计算机应用》2012年 第2期 407-410页 共4页
【收 录】 中文科技期刊数据库