基于文档指纹的中文复制检测方法

麻会东 刘国华 李现伟 刘春辉

燕山大学信息科学与工程学院,河北秦皇岛066004

摘  要:

文档复制检测技术是保护知识产权和提高信息检索效率的有效有段。目前,关于英文的复制检测技术已经趋向成熟,但关于中文的复制检测技术才刚刚起步。在此提出基于文档指纹的中文复制检测方法,改进了正向最大匹配分词方法并建立了相应的语料库机制,提出k-words分解句子的方法;定义了两篇文档同粒度指纹矩阵之间的匹配运算。实验结果表明,所提出的方法能高效地进行中文文档复制检测。 (共4页)

相关文章:

主题相关 参考文献(5篇) 耦合文献(3篇) 

参考文献

更多文章搜索 
中国业务群个人门户,免费下载!
征稿启事
相关文章+更多
社区热帖+更多
天元数据 维普资讯 版权所有 Copyright © 2001-2008 cqvip.com Inc. All rights reserved.
渝ICP证 B2-20050021  违法和不良信息举报中心
建议使用:1024x768分辨率,16位以上颜色