程序包 | 说明 |
---|---|
org.apdplat.word.lucene | |
org.apdplat.word.segmentation | |
org.apdplat.word.segmentation.impl |
构造器和说明 |
---|
ChineseWordAnalyzer(Segmentation segmentation) |
ChineseWordTokenizer(Reader input,
Segmentation segmentation) |
限定符和类型 | 方法和说明 |
---|---|
static Segmentation |
SegmentationFactory.getSegmentation(SegmentationAlgorithm segmentationAlgorithm) |
限定符和类型 | 类和说明 |
---|---|
class |
AbstractSegmentation
分词算法抽象类
|
class |
BidirectionalMaximumMatching
基于词典的双向最大匹配算法
Dictionary-based bidirectional maximum matching algorithm
|
class |
BidirectionalMaximumMinimumMatching
基于词典的双向最大最小匹配算法
Dictionary-based bidirectional maximum minimum matching algorithm
利用ngram从
逆向最大匹配、正向最大匹配、逆向最小匹配、正向最小匹配
4种切分结果中选择一种最好的分词结果
如果分值都一样,则选择逆向最大匹配
实验表明,对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效
|
class |
BidirectionalMinimumMatching
基于词典的双向最小匹配算法
Dictionary-based bidirectional minimum matching algorithm
|
class |
FullSegmentation
基于词典的全切分算法
Dictionary-based full segmentation algorithm
利用ngram给每一种切分结果计算分值
如果多个切分结果分值相同,则选择切分出的词的个数最少的切分结果(最少分词原则)
|
class |
MaximumMatching
基于词典的正向最大匹配算法
Dictionary-based maximum matching algorithm
|
class |
MinimumMatching
基于词典的正向最小匹配算法
Dictionary-based minimum matching algorithm
|
class |
ReverseMaximumMatching
基于词典的逆向最大匹配算法
Dictionary-based reverse maximum matching algorithm
|
class |
ReverseMinimumMatching
基于词典的逆向最小匹配算法
Dictionary-based reverse minimum matching algorithm
|
Copyright © 2014 APDPlat. All rights reserved.