Package | Description |
---|---|
org.apdplat.word.segmentation.impl |
Modifier and Type | Class and Description |
---|---|
class |
AbstractSegmentation
基于词典的分词算法抽象类
|
class |
BidirectionalMaximumMatching
基于词典的双向最大匹配算法
Dictionary-based bidirectional maximum matching algorithm
|
class |
BidirectionalMaximumMinimumMatching
基于词典的双向最大最小匹配算法
Dictionary-based bidirectional maximum minimum matching algorithm
利用ngram从
逆向最大匹配、正向最大匹配、逆向最小匹配、正向最小匹配
4种切分结果中选择一种最好的分词结果
如果分值都一样,则选择逆向最大匹配
实验表明,对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效
|
class |
BidirectionalMinimumMatching
基于词典的双向最小匹配算法
Dictionary-based bidirectional minimum matching algorithm
|
class |
FullSegmentation
基于词典的全切分算法
Dictionary-based full segmentation algorithm
利用ngram给每一种切分结果计算分值
如果多个切分结果分值相同,则选择切分出的词的个数最少的切分结果(最少分词原则)
|
class |
MaximumMatching
基于词典的正向最大匹配算法
Dictionary-based maximum matching algorithm
|
class |
MaxNgramScore
最大Ngram分值算法
Dictionary-based max ngram score segmentation algorithm
最大N元模型分值算法是指从切分结果里面选择切分出来的词的ngram分值最大的结果
利用ngram给切分结果计算分值
接着按分值从大到小排序
然后选择第一个结果
如果所有切分结果都没有ngram分值
则算法退化为 最少词数算法(org.apdplat.word.segmentation.impl.MinimalWordCount)
|
class |
MinimalWordCount
最少词数算法
Dictionary-based minimal word count segmentation algorithm
最少词数算法是指从切分结果里面选择切分出来的词的个数最少的结果
如果有多个切分结果的词的个数相同
则利用ngram给这些切分结果计算分值
接着按分值从大到小排序
最后选择第一个结果
|
class |
MinimumMatching
基于词典的正向最小匹配算法
Dictionary-based minimum matching algorithm
|
class |
ReverseMaximumMatching
基于词典的逆向最大匹配算法
Dictionary-based reverse maximum matching algorithm
|
class |
ReverseMinimumMatching
基于词典的逆向最小匹配算法
Dictionary-based reverse minimum matching algorithm
|
Copyright © 2014–2015 APDPlat. All rights reserved.