接口 | 说明 |
---|---|
Dictionary |
词典
|
类 | 说明 |
---|---|
DictionaryFactory |
词典工厂
通过系统属性及配置文件指定词典实现类(dic.class)和词典文件(dic.path)
指定方式一,编程指定(高优先级):
WordConfTools.set("dic.class", "org.apdplat.word.dictionary.impl.DictionaryTrie");
WordConfTools.set("dic.path", "classpath:dic.txt");
指定方式二,Java虚拟机启动参数(中优先级):
java -Ddic.class=org.apdplat.word.dictionary.impl.DictionaryTrie -Ddic.path=classpath:dic.txt
指定方式三,配置文件指定(低优先级):
在类路径下的word.conf中指定配置信息
dic.class=org.apdplat.word.dictionary.impl.DictionaryTrie
dic.path=classpath:dic.txt
如未指定,则默认使用词典实现类(org.apdplat.word.dictionary.impl.DictionaryTrie)和词典文件(类路径下的dic.txt)
|
DictionaryTools |
词典工具
1、把多个词典合并为一个并规范清理
词长度:只保留大于等于2并且小于等于4的长度的词
识别功能: 移除能识别的词
移除非中文词:防止大量无意义或特殊词混入词典
2、移除词典中的短语结构
|
Copyright © 2014–2015 APDPlat. All rights reserved.