一种基于变型B-树的中文自动分词词典机制

吴昊 潘无名 王硕 杨博

四川大学计算机学院,成都610065

摘  要:

中文自动分词技术是许多中文智能领域尤其是中文信息的数据净化和数据挖掘的基础技术,而分词词典又是影响到中文自动分词的重要因素。本文针对中文地址数据净化和挖掘的具体需要提出了一种新的词典机制,即基于首字HASH,逐字二分和变型B-树的词典,从而明显提高了对短词的处理速度。
页  数:
共2页
页码范围:
37-38页

相关文章:

主题相关
相关期刊+更多
    社区热帖+更多
    • 快讯