Class | Description |
---|---|
PersonName |
人名识别
|
Punctuation |
判断一个字符是否是标点符号
|
Quantifier |
数量词识别
|
RecognitionTool |
分词特殊情况识别工具
如英文单词、数字、时间等
|
StopWord |
停用词判定
通过系统属性及配置文件指定停用词词典(stopwords.path)
指定方式一,编程指定(高优先级):
WordConfTools.set("stopwords.path", "classpath:stopwords.txt");
指定方式二,Java虚拟机启动参数(中优先级):
java -Dstopwords.path=classpath:stopwords.txt
指定方式三,配置文件指定(低优先级):
在类路径下的word.conf中指定配置信息
stopwords.path=classpath:stopwords.txt
如未指定,则默认使用停用词词典文件(类路径下的stopwords.txt)
|
Copyright © 2014–2015 APDPlat. All rights reserved.