跳过导航链接
A B C D E F G H I K L M N O P Q R S T U V W 

A

AbstractSegmentation - org.apdplat.word.segmentation.impl中的类
分词算法抽象类
AbstractSegmentation() - 类 的构造器org.apdplat.word.segmentation.impl.AbstractSegmentation
 
add(String) - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
add(String) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
add(String) - 接口 中的方法org.apdplat.word.util.ResourceLoader
动态增加一行数据
addAll(List<String>) - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
addAll(List<String>) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
addWord(List<Word>, String, int, int) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
将识别出的词放入队列
addWord(Stack<Word>, String, int, int) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
将识别出的词入栈
AutoDetector - org.apdplat.word.util中的类
资源变化自动检测
AutoDetector() - 类 的构造器org.apdplat.word.util.AutoDetector
 

B

BidirectionalMaximumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的双向最大匹配算法 Dictionary-based bidirectional maximum matching algorithm
BidirectionalMaximumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.BidirectionalMaximumMatching
 
BidirectionalMaximumMinimumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的双向最大最小匹配算法 Dictionary-based bidirectional maximum minimum matching algorithm 利用ngram从 逆向最大匹配、正向最大匹配、逆向最小匹配、正向最小匹配 4种切分结果中选择一种最好的分词结果 如果分值都一样,则选择逆向最大匹配 实验表明,对于汉语来说,逆向最大匹配算法比(正向)最大匹配算法更有效
BidirectionalMaximumMinimumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.BidirectionalMaximumMinimumMatching
 
BidirectionalMinimumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的双向最小匹配算法 Dictionary-based bidirectional minimum matching algorithm
BidirectionalMinimumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.BidirectionalMinimumMatching
 
Bigram - org.apdplat.word.corpus中的类
二元语法模型
Bigram() - 类 的构造器org.apdplat.word.corpus.Bigram
 
bigram(List<Word>...) - 类 中的静态方法org.apdplat.word.corpus.Bigram
含有语境的二元模型分值算法 计算多种分词结果的分值 利用获得的二元模型分值重新计算分词结果的分值 补偿细粒度切分获得分值而粗粒度切分未获得分值的情况
bigram(List<Word>) - 类 中的静态方法org.apdplat.word.corpus.Bigram
计算分词结果的二元模型分值

C

ChineseWordAnalysisBinderProcessor - org.apdplat.word.elasticsearch中的类
中文分词组件注册
ChineseWordAnalysisBinderProcessor() - 类 的构造器org.apdplat.word.elasticsearch.ChineseWordAnalysisBinderProcessor
 
ChineseWordAnalyzer - org.apdplat.word.lucene中的类
Lucene中文分析器
ChineseWordAnalyzer() - 类 的构造器org.apdplat.word.lucene.ChineseWordAnalyzer
 
ChineseWordAnalyzer(Segmentation) - 类 的构造器org.apdplat.word.lucene.ChineseWordAnalyzer
 
ChineseWordAnalyzerProvider - org.apdplat.word.elasticsearch中的类
中文分析器工厂
ChineseWordAnalyzerProvider(Index, Settings, Environment, String, Settings) - 类 的构造器org.apdplat.word.elasticsearch.ChineseWordAnalyzerProvider
 
ChineseWordIndicesAnalysis - org.apdplat.word.elasticsearch中的类
中文分词索引分析组件
ChineseWordIndicesAnalysis(Settings, IndicesAnalysisService) - 类 的构造器org.apdplat.word.elasticsearch.ChineseWordIndicesAnalysis
 
ChineseWordIndicesAnalysisModule - org.apdplat.word.elasticsearch中的类
中文分词索引分析模块
ChineseWordIndicesAnalysisModule() - 类 的构造器org.apdplat.word.elasticsearch.ChineseWordIndicesAnalysisModule
 
ChineseWordPlugin - org.apdplat.word.elasticsearch中的类
中文分词组件(word)的ElasticSearch插件
ChineseWordPlugin() - 类 的构造器org.apdplat.word.elasticsearch.ChineseWordPlugin
 
ChineseWordTokenizer - org.apdplat.word.lucene中的类
Lucene中文分词器
ChineseWordTokenizer(Reader) - 类 的构造器org.apdplat.word.lucene.ChineseWordTokenizer
 
ChineseWordTokenizer(Reader, Segmentation) - 类 的构造器org.apdplat.word.lucene.ChineseWordTokenizer
 
ChineseWordTokenizerFactory - org.apdplat.word.elasticsearch中的类
中文分词器工厂
ChineseWordTokenizerFactory(Index, Settings, String, Settings) - 类 的构造器org.apdplat.word.elasticsearch.ChineseWordTokenizerFactory
 
ChineseWordTokenizerFactory - org.apdplat.word.solr中的类
Lucene中文分词器工厂
ChineseWordTokenizerFactory(Map<String, String>) - 类 的构造器org.apdplat.word.solr.ChineseWordTokenizerFactory
 
clear() - 类 中的方法org.apdplat.word.corpus.GramTrie
 
clear() - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
clear() - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
clear() - 接口 中的方法org.apdplat.word.util.ResourceLoader
清空数据
close() - 类 中的方法org.apdplat.word.util.DirectoryWatcher
关闭监控线程
compareTo(Object) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
configure() - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordIndicesAnalysisModule
 
contains(String, int, int) - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
contains(String) - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
contains(String) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
contains(String, int, int) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
CorpusMerge - org.apdplat.word.corpus中的类
将多个语料库文件合并为一个
CorpusMerge() - 类 的构造器org.apdplat.word.corpus.CorpusMerge
 
CorpusTools - org.apdplat.word.corpus中的类
语料库工具 用于构建二元模型和三元模型并做进一步的分析处理 同时把语料库中的新词加入词典
CorpusTools() - 类 的构造器org.apdplat.word.corpus.CorpusTools
 
create(Reader) - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordTokenizerFactory
 
create(AttributeFactory, Reader) - 类 中的方法org.apdplat.word.solr.ChineseWordTokenizerFactory
 
createComponents(String, Reader) - 类 中的方法org.apdplat.word.lucene.ChineseWordAnalyzer
 

D

deleteDir(File) - 类 中的静态方法org.apdplat.word.util.Utils
删除目录
description() - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordPlugin
 
DIC - 类 中的静态变量org.apdplat.word.segmentation.impl.AbstractSegmentation
 
Dictionary - org.apdplat.word.dictionary中的接口
词典
DictionaryFactory - org.apdplat.word.dictionary中的类
词典工厂 通过系统属性及配置文件指定词典实现类(dic.class)和词典文件(dic.path) 指定方式一,编程指定(高优先级): WordConfTools.set("dic.class", "org.apdplat.word.dictionary.impl.DictionaryTrie"); WordConfTools.set("dic.path", "classpath:dic.txt"); 指定方式二,Java虚拟机启动参数(中优先级): java -Ddic.class=org.apdplat.word.dictionary.impl.DictionaryTrie -Ddic.path=classpath:dic.txt 指定方式三,配置文件指定(低优先级): 在类路径下的word.conf中指定配置信息 dic.class=org.apdplat.word.dictionary.impl.DictionaryTrie dic.path=classpath:dic.txt 如未指定,则默认使用词典实现类(org.apdplat.word.dictionary.impl.DictionaryTrie)和词典文件(类路径下的dic.txt)
DictionaryTools - org.apdplat.word.dictionary中的类
词典工具 1、把多个词典合并为一个并规范清理 词长度:只保留大于等于2并且小于等于4的长度的词 识别功能: 移除能识别的词 移除非中文词:防止大量无意义或特殊词混入词典 2、移除词典中的短语结构
DictionaryTools() - 类 的构造器org.apdplat.word.dictionary.DictionaryTools
 
DictionaryTrie - org.apdplat.word.dictionary.impl中的类
前缀树的Java实现 为前缀树的一级节点建立索引(比二分查找要快) 用于查找一个指定的字符串是否在字典中
DictionaryTrie() - 类 的构造器org.apdplat.word.dictionary.impl.DictionaryTrie
 
DirectoryWatcher - org.apdplat.word.util中的类
文件系统目录和文件监控服务
DirectoryWatcher.WatcherCallback - org.apdplat.word.util中的接口
 
Distance - org.apdplat.word.vector中的类
计算词和词的相似性
Distance() - 类 的构造器org.apdplat.word.vector.Distance
 

E

equals(Object) - 类 中的方法org.apdplat.word.segmentation.Word
 
Evaluation - org.apdplat.word.corpus中的类
利用人工标注的语料库 对分词算法效果进行评估 评估采用的测试文本有253 3709行,共2837 4490个字符 评估结果位于target/evaluation目录下: corpus-text.txt为分好词的人工标注文本,词之间以空格分隔 test-text.txt为测试文本,是把corpus-text.txt以标点符号分隔为多行的结果 standard-text.txt为测试文本对应的人工标注文本,作为分词是否正确的标准 result-text-***,***为各种分词算法名称,这是word分词结果 perfect-result-***,***为各种分词算法名称,这是分词结果和人工标注标准完全一致的文本 wrong-result-***,***为各种分词算法名称,这是分词结果和人工标注标准不一致的文本
Evaluation() - 类 的构造器org.apdplat.word.corpus.Evaluation
 
evaluation(String, String, String, String) - 类 中的静态方法org.apdplat.word.corpus.Evaluation
分词效果评估
evaluation(String, String) - 类 中的静态方法org.apdplat.word.corpus.Evaluation
分词效果评估
EvaluationResult - org.apdplat.word.corpus中的类
中文分词效果评估结果
EvaluationResult() - 类 的构造器org.apdplat.word.corpus.EvaluationResult
 
execute(WatchEvent.Kind<?>, String) - 接口 中的方法org.apdplat.word.util.DirectoryWatcher.WatcherCallback
 
extractFromCorpus(String, String, boolean) - 类 中的静态方法org.apdplat.word.corpus.ExtractText
从语料库中抽取内容
ExtractText - org.apdplat.word.corpus中的类
从语料库中抽取文本
ExtractText() - 类 的构造器org.apdplat.word.corpus.ExtractText
 

F

filterStopWords(List<Word>) - 类 中的静态方法org.apdplat.word.WordSegmenter
移除停用词
forceOverride(String) - 类 中的静态方法org.apdplat.word.util.WordConfTools
强制覆盖默认配置
FullSegmentation - org.apdplat.word.segmentation.impl中的类
基于词典的全切分算法 Dictionary-based full segmentation algorithm 利用ngram给每一种切分结果计算分值 如果多个切分结果分值相同,则选择切分出的词的个数最少的切分结果(最少分词原则)
FullSegmentation() - 类 的构造器org.apdplat.word.segmentation.impl.FullSegmentation
 

G

generateDataset(String, String, String) - 类 中的静态方法org.apdplat.word.corpus.Evaluation
生成测试数据集和标准数据集
get(String, int) - 类 中的静态方法org.apdplat.word.analysis.HotWord
 
get(String) - 类 中的方法org.apdplat.word.corpus.GramTrie
 
get(String, int, int) - 类 中的方法org.apdplat.word.corpus.GramTrie
 
get() - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordAnalyzerProvider
 
get(String, String) - 类 中的静态方法org.apdplat.word.util.WordConfTools
 
get(String) - 类 中的静态方法org.apdplat.word.util.WordConfTools
 
getCharPerfectRate() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getCharWrongRate() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getDes() - 枚举 中的方法org.apdplat.word.segmentation.SegmentationAlgorithm
 
getDictionary() - 类 中的静态方法org.apdplat.word.dictionary.DictionaryFactory
 
getDirectoryWatcher(DirectoryWatcher.WatcherCallback, WatchEvent.Kind<?>...) - 类 中的静态方法org.apdplat.word.util.DirectoryWatcher
 
getInt(String, int) - 类 中的静态方法org.apdplat.word.util.WordConfTools
 
getInt(String) - 类 中的静态方法org.apdplat.word.util.WordConfTools
 
getInterceptLength() - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
分词时截取的字符串的最大长度
getLinePerfectRate() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getLineWrongRate() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getMaxLength() - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
getMaxLength() - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
getPerfectCharCount() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getPerfectLineCount() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getScore(String, String) - 类 中的静态方法org.apdplat.word.corpus.Bigram
获取两个词一前一后紧挨着同时出现在语料库中的分值
getScore(String, String, String) - 类 中的静态方法org.apdplat.word.corpus.Trigram
获取三个词前后紧挨着同时出现在语料库中的分值
getSegmentation(SegmentationAlgorithm) - 类 中的静态方法org.apdplat.word.segmentation.SegmentationFactory
 
getSegmentationAlgorithm() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getSegSpeed() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getSortedMapByValue(Map<K, V>) - 类 中的静态方法org.apdplat.word.util.Utils
根据MAP的VALUE进行排序
getSurname(String) - 类 中的静态方法org.apdplat.word.recognition.PersonName
如果文本为人名,则返回姓
getSurnames() - 类 中的静态方法org.apdplat.word.recognition.PersonName
获取所有的姓
getText() - 类 中的方法org.apdplat.word.segmentation.Word
 
getTotalCharCount() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getTotalLineCount() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getWord(String, int, int) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
获取一个已经识别的词
getWrongCharCount() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
getWrongLineCount() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
GramTrie - org.apdplat.word.corpus中的类
ngram数据结构,高效存储,快速搜索 使用前缀树来实现 为前缀树的一级节点建立索引(比二分查找要快)
GramTrie() - 类 的构造器org.apdplat.word.corpus.GramTrie
 

H

has(String) - 类 中的静态方法org.apdplat.word.recognition.Punctuation
判断文本中是否包含标点符号
hashCode() - 类 中的方法org.apdplat.word.segmentation.Word
 
HotWord - org.apdplat.word.analysis中的类
利用NGRAM做热词分析
HotWord() - 类 的构造器org.apdplat.word.analysis.HotWord
 

I

incrementToken() - 类 中的方法org.apdplat.word.lucene.ChineseWordTokenizer
 
is(String) - 类 中的静态方法org.apdplat.word.recognition.PersonName
人名判定
is(char) - 类 中的静态方法org.apdplat.word.recognition.Punctuation
判断一个字符是否是标点符号
is(char) - 类 中的静态方法org.apdplat.word.recognition.Quantifier
 
is(String) - 类 中的静态方法org.apdplat.word.recognition.StopWord
判断一个词是否是停用词
isChineseCharAndLengthAtLeastOne(String) - 类 中的静态方法org.apdplat.word.util.Utils
至少出现一次中文字符,且以中文字符开头和结束
isChineseCharAndLengthAtLeastTwo(String) - 类 中的静态方法org.apdplat.word.util.Utils
至少出现两次中文字符,且以中文字符开头和结束
isChineseNumber(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
中文数字识别,包括大小写
isEnglish(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
英文单词识别
isEnglish(char) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
英文字符识别,包括大小写,包括全角和半角
isEnglishAndNumberMix(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
英文字母和数字混合识别,能识别纯数字、纯英文单词以及混合的情况
isFraction(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
小数和分数识别
isNumber(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
数字识别
isNumber(char) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
阿拉伯数字识别,包括全角和半角
isQuantifier(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
数量词识别,如日期、时间、长度、容量、重量、面积等等
isSurname(String) - 类 中的静态方法org.apdplat.word.recognition.PersonName
判断文本是不是百家姓
isWhiteSpace(String, int, int) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
判断索引下标为start的字符是否为空白字符 这个方法只用在这里 为了速度,不检查索引下标是否越界
isWhiteSpace(char) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
判断指定的字符是否是空白字符

K

KEEP_PUNCTUATION - 类 中的静态变量org.apdplat.word.segmentation.impl.AbstractSegmentation
 
KEEP_WHITESPACE - 类 中的静态变量org.apdplat.word.segmentation.impl.AbstractSegmentation
 

L

load(List<String>) - 接口 中的方法org.apdplat.word.util.ResourceLoader
初始加载全部数据
loadAndWatch(ResourceLoader, String) - 类 中的静态方法org.apdplat.word.util.AutoDetector
加载资源并自动检测资源变化 当资源发生变化的时候重新自动加载
LOGGER - 类 中的静态变量org.apdplat.word.segmentation.impl.AbstractSegmentation
 

M

main(String[]) - 类 中的静态方法org.apdplat.word.analysis.HotWord
 
main(String[]) - 类 中的静态方法org.apdplat.word.corpus.CorpusMerge
 
main(String[]) - 类 中的静态方法org.apdplat.word.corpus.CorpusTools
 
main(String[]) - 类 中的静态方法org.apdplat.word.corpus.Evaluation
 
main(String[]) - 类 中的静态方法org.apdplat.word.corpus.ExtractText
 
main(String[]) - 类 中的静态方法org.apdplat.word.corpus.GramTrie
 
main(String[]) - 类 中的静态方法org.apdplat.word.dictionary.DictionaryTools
 
main(String[]) - 类 中的静态方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
main(String[]) - 类 中的静态方法org.apdplat.word.lucene.ChineseWordAnalyzer
 
main(String[]) - 类 中的静态方法org.apdplat.word.recognition.PersonName
 
main(String[]) - 类 中的静态方法org.apdplat.word.recognition.Punctuation
 
main(String[]) - 类 中的静态方法org.apdplat.word.recognition.Quantifier
 
main(String[]) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
 
main(String[]) - 类 中的静态方法org.apdplat.word.recognition.StopWord
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.AbstractSegmentation
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.BidirectionalMaximumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.BidirectionalMaximumMinimumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.BidirectionalMinimumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.FullSegmentation
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.MaximumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.MinimumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.ReverseMaximumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.segmentation.impl.ReverseMinimumMatching
 
main(String[]) - 类 中的静态方法org.apdplat.word.util.AutoDetector
 
main(String[]) - 类 中的静态方法org.apdplat.word.util.DirectoryWatcher
 
main(String[]) - 类 中的静态方法org.apdplat.word.util.WordConfTools
 
main(String[]) - 类 中的静态方法org.apdplat.word.vector.Distance
 
main(String[]) - 类 中的静态方法org.apdplat.word.vector.Word2Vector
 
main(String[]) - 类 中的静态方法org.apdplat.word.WordSegmenter
 
MaximumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的正向最大匹配算法 Dictionary-based maximum matching algorithm
MaximumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.MaximumMatching
 
merge(String, String) - 类 中的静态方法org.apdplat.word.corpus.CorpusMerge
将多个语料库文件合并为一个
merge(List<String>, String) - 类 中的静态方法org.apdplat.word.dictionary.DictionaryTools
把多个词典合并为一个
MinimumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的正向最小匹配算法 Dictionary-based minimum matching algorithm
MinimumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.MinimumMatching
 
modules() - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordPlugin
 

N

name() - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordPlugin
 
ngram(List<Word>...) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
利用ngram进行评分
ngramEnabled() - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
是否启用ngram

O

onModule(AnalysisModule) - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordPlugin
 
org.apdplat.word - 程序包 org.apdplat.word
 
org.apdplat.word.analysis - 程序包 org.apdplat.word.analysis
 
org.apdplat.word.corpus - 程序包 org.apdplat.word.corpus
 
org.apdplat.word.dictionary - 程序包 org.apdplat.word.dictionary
 
org.apdplat.word.dictionary.impl - 程序包 org.apdplat.word.dictionary.impl
 
org.apdplat.word.elasticsearch - 程序包 org.apdplat.word.elasticsearch
 
org.apdplat.word.lucene - 程序包 org.apdplat.word.lucene
 
org.apdplat.word.recognition - 程序包 org.apdplat.word.recognition
 
org.apdplat.word.segmentation - 程序包 org.apdplat.word.segmentation
 
org.apdplat.word.segmentation.impl - 程序包 org.apdplat.word.segmentation.impl
 
org.apdplat.word.solr - 程序包 org.apdplat.word.solr
 
org.apdplat.word.util - 程序包 org.apdplat.word.util
 
org.apdplat.word.vector - 程序包 org.apdplat.word.vector
 

P

PERSON_NAME_RECOGNIZE - 类 中的静态变量org.apdplat.word.segmentation.impl.AbstractSegmentation
 
PersonName - org.apdplat.word.recognition中的类
人名识别
PersonName() - 类 的构造器org.apdplat.word.recognition.PersonName
 
prefix(String) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
processAnalyzers(AnalysisModule.AnalysisBinderProcessor.AnalyzersBindings) - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordAnalysisBinderProcessor
 
processCommand(String...) - 类 中的静态方法org.apdplat.word.WordSegmenter
 
processTokenizers(AnalysisModule.AnalysisBinderProcessor.TokenizersBindings) - 类 中的方法org.apdplat.word.elasticsearch.ChineseWordAnalysisBinderProcessor
 
Punctuation - org.apdplat.word.recognition中的类
判断一个字符是否是标点符号
Punctuation() - 类 的构造器org.apdplat.word.recognition.Punctuation
 
put(String, int) - 类 中的方法org.apdplat.word.corpus.GramTrie
 

Q

Quantifier - org.apdplat.word.recognition中的类
数量词识别
Quantifier() - 类 的构造器org.apdplat.word.recognition.Quantifier
 

R

recog(String) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
识别文本(英文单词、数字、时间等)
recog(String, int, int) - 类 中的静态方法org.apdplat.word.recognition.RecognitionTool
识别文本(英文单词、数字、时间等)
RecognitionTool - org.apdplat.word.recognition中的类
分词特殊情况识别工具 如英文单词、数字、时间等
RecognitionTool() - 类 的构造器org.apdplat.word.recognition.RecognitionTool
 
recognize(List<Word>) - 类 中的静态方法org.apdplat.word.recognition.PersonName
对分词结果进行处理,识别人名
reload() - 类 中的静态方法org.apdplat.word.corpus.Bigram
 
reload() - 类 中的静态方法org.apdplat.word.corpus.Trigram
 
reload() - 类 中的静态方法org.apdplat.word.dictionary.DictionaryFactory
 
reload() - 类 中的静态方法org.apdplat.word.recognition.PersonName
 
reload() - 类 中的静态方法org.apdplat.word.recognition.Punctuation
 
reload() - 类 中的静态方法org.apdplat.word.recognition.Quantifier
 
reload() - 类 中的静态方法org.apdplat.word.recognition.StopWord
 
reload() - 类 中的静态方法org.apdplat.word.util.WordConfTools
重新加载配置文件
remove(String) - 类 中的方法org.apdplat.word.corpus.GramTrie
移除ngram
remove(String) - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
remove(String) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
remove(String) - 接口 中的方法org.apdplat.word.util.ResourceLoader
动态移除一行数据
removeAll(List<String>) - 接口 中的方法org.apdplat.word.dictionary.Dictionary
 
removeAll(List<String>) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
removePhraseFromDic(String, String) - 类 中的静态方法org.apdplat.word.dictionary.DictionaryTools
移除词典中的短语结构
ResourceLoader - org.apdplat.word.util中的接口
资源加载接口
ReverseMaximumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的逆向最大匹配算法 Dictionary-based reverse maximum matching algorithm
ReverseMaximumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.ReverseMaximumMatching
 
ReverseMinimumMatching - org.apdplat.word.segmentation.impl中的类
基于词典的逆向最小匹配算法 Dictionary-based reverse minimum matching algorithm
ReverseMinimumMatching() - 类 的构造器org.apdplat.word.segmentation.impl.ReverseMinimumMatching
 

S

seg(String, boolean, char...) - 类 中的静态方法org.apdplat.word.recognition.Punctuation
将一段文本根据标点符号分割为多个不包含标点符号的文本 可指定要保留那些标点符号
seg(String) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
默认分词算法实现: 1、把要分词的文本根据标点符号进行分割 2、对分割后的文本进行分词 3、组合分词结果
seg(String) - 接口 中的方法org.apdplat.word.segmentation.Segmentation
 
seg(String, SegmentationAlgorithm) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文本进行分词,移除停用词 可指定其他分词算法
seg(String) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文本进行分词,移除停用词 使用双向最大匹配算法
seg(File, File, SegmentationAlgorithm) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文件进行分词,移除停用词 可指定其他分词算法
seg(File, File) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文件进行分词,移除停用词 使用双向最大匹配算法
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.AbstractSegmentation
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.BidirectionalMaximumMatching
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.BidirectionalMaximumMinimumMatching
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.BidirectionalMinimumMatching
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.FullSegmentation
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.MaximumMatching
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.MinimumMatching
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.ReverseMaximumMatching
 
segImpl(String) - 类 中的方法org.apdplat.word.segmentation.impl.ReverseMinimumMatching
 
Segmentation - org.apdplat.word.segmentation中的接口
分词接口 Word Segmentation Interface
SegmentationAlgorithm - org.apdplat.word.segmentation中的枚举
中文分词算法 Chinese word segmentation algorithm
SegmentationFactory - org.apdplat.word.segmentation中的类
中文分词工厂类 根据指定的分词算法返回分词实现
segWithStopWords(String, SegmentationAlgorithm) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文本进行分词,保留停用词 可指定其他分词算法
segWithStopWords(String) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文本进行分词,保留停用词 使用双向最大匹配算法
segWithStopWords(File, File, SegmentationAlgorithm) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文件进行分词,保留停用词 可指定其他分词算法
segWithStopWords(File, File) - 类 中的静态方法org.apdplat.word.WordSegmenter
对文件进行分词,保留停用词 使用双向最大匹配算法
set(String, String) - 类 中的静态方法org.apdplat.word.util.WordConfTools
 
setPerfectCharCount(int) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setPerfectLineCount(int) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setSegmentationAlgorithm(SegmentationAlgorithm) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setSegSpeed(float) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setText(String) - 类 中的方法org.apdplat.word.segmentation.Word
 
setTotalCharCount(int) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setTotalLineCount(int) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setWrongCharCount(int) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
setWrongLineCount(int) - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
show(char) - 类 中的方法org.apdplat.word.corpus.GramTrie
 
show() - 类 中的方法org.apdplat.word.corpus.GramTrie
 
show(char) - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
show() - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
 
showConflict() - 类 中的方法org.apdplat.word.corpus.GramTrie
统计根节点冲突情况及预分配的数组空间利用情况
showConflict() - 类 中的方法org.apdplat.word.dictionary.impl.DictionaryTrie
统计根节点冲突情况及预分配的数组空间利用情况
StopWord - org.apdplat.word.recognition中的类
停用词判定 通过系统属性及配置文件指定停用词词典(stopwords.path) 指定方式一,编程指定(高优先级): WordConfTools.set("stopwords.path", "classpath:stopwords.txt"); 指定方式二,Java虚拟机启动参数(中优先级): java -Dstopwords.path=classpath:stopwords.txt 指定方式三,配置文件指定(低优先级): 在类路径下的word.conf中指定配置信息 stopwords.path=classpath:stopwords.txt 如未指定,则默认使用停用词词典文件(类路径下的stopwords.txt)
StopWord() - 类 的构造器org.apdplat.word.recognition.StopWord
 

T

toString() - 类 中的方法org.apdplat.word.corpus.EvaluationResult
 
toString() - 类 中的方法org.apdplat.word.segmentation.Word
 
Trigram - org.apdplat.word.corpus中的类
三元语法模型
Trigram() - 类 的构造器org.apdplat.word.corpus.Trigram
 
trigram(List<Word>...) - 类 中的静态方法org.apdplat.word.corpus.Trigram
一次性计算多种分词结果的三元模型分值
trigram(List<Word>) - 类 中的静态方法org.apdplat.word.corpus.Trigram
计算分词结果的三元模型分值

U

Utils - org.apdplat.word.util中的类
工具类
Utils() - 类 的构造器org.apdplat.word.util.Utils
 

V

valueOf(String) - 枚举 中的静态方法org.apdplat.word.segmentation.SegmentationAlgorithm
返回带有指定名称的该类型的枚举常量。
values() - 枚举 中的静态方法org.apdplat.word.segmentation.SegmentationAlgorithm
按照声明该枚举类型的常量的顺序, 返回 包含这些常量的数组。

W

watchDirectory(String) - 类 中的方法org.apdplat.word.util.DirectoryWatcher
监控指定目录,不监控子目录
watchDirectory(Path) - 类 中的方法org.apdplat.word.util.DirectoryWatcher
监控指定目录,不监控子目录
watchDirectoryTree(String) - 类 中的方法org.apdplat.word.util.DirectoryWatcher
监控指定的目录及其所有子目录
watchDirectoryTree(Path) - 类 中的方法org.apdplat.word.util.DirectoryWatcher
监控指定的目录及其所有子目录
Word - org.apdplat.word.segmentation中的类
词 Word
Word(String) - 类 的构造器org.apdplat.word.segmentation.Word
 
Word2Vector - org.apdplat.word.vector中的类
用词向量来表达一个词
Word2Vector() - 类 的构造器org.apdplat.word.vector.Word2Vector
 
WordConfTools - org.apdplat.word.util中的类
获取配置信息的工具类
WordConfTools() - 类 的构造器org.apdplat.word.util.WordConfTools
 
WordSegmenter - org.apdplat.word中的类
中文分词基础入口 默认使用双向最大匹配算法 也可指定其他分词算法
WordSegmenter() - 类 的构造器org.apdplat.word.WordSegmenter
 
A B C D E F G H I K L M N O P Q R S T U V W 
跳过导航链接

Copyright © 2014 APDPlat. All rights reserved.