您的位置:网站首页 > 《中文科技期刊数据库》 > 工程技术 > 自动化计算机 > 计算机应用 > 摘要

基于依存分析和错误驱动的中文时间表达式识别

《中文信息学报》2007年 第5期 | 贺瑞芳 秦兵 刘挺 潘越群 李生   哈尔滨工业大学信息检索研究室 黑龙江哈尔滨150001
在线阅读 ★ 收藏 | 分享
  • 第1页
  • 第2页
  • 第3页
  • 第4页
摘 要:时间表达式识别是进行时间表达式归一化的基础,其识别结果的好坏直接影响归一化的效果。本文提出一种基于依存分析和错误驱动识别中文时间表达式的新方法。首先以时间触发词为切入点,据依存关系递归地识别时间表达式,大大地提高了识别效果;然后,采用错误驱动学习来进一步增强识别效果,根据错误识别结果和人工标注的差异自动地获取和改进规则,使系统的性能又提高了近3.5%。最终在封闭测试集和开放测试集上,F1值达到了76.38%和76.57%。
【分 类】【工业技术】 > 自动化技术、计算机技术 > 计算技术、计算机技术 > 计算机的应用 > 信息处理(信息加工)
【关键词】 计算机应用 中文信息处理 时间表达式识别 触发词 依存分析 错误驱动学习
【出 处】 《中文信息学报》2007年 第5期 36-40页 共5页
【收 录】 中文科技期刊数据库