IT宅
A brief history of the future of AI in education
网络
图解网络协议
图解高性能网络编程
存储
图解 Redis 原理
图解 MySQL 原理
架构
重构速查表
架构模式
分布式
码解 Dubbo 实现
图解消息队列原理
精进之路
MySQL
MQ
JVM
更多专栏
重构速查表
架构模式
归档
所有专栏
专栏推荐
查看更多
架构解码:模式与实践
软件架构与模式
JVM速成手册
JVM相关内容
图解网络协议
详解网络分层和网络协议工作原理
并发编程
并发编程原理和应用
数据结构与算法
数据结构与算法知识详解
重构速查表
重构的相关技能
图解 MySQL 原理
洞悉MySQL底层架构与SQL调优本质
图解 Redis 原理
洞悉Redis技术内幕:缓存,数据结构,并发,集群与算法
IKAnalyzer
2
IKAnalyzer词典占用内存大小分析
这里还是使用搜狗的扩展词库
Java
IKAnalyzer
Instrumentation
内存
作者:arthinking
|
发表于 2014-06-09
|
分类于
J2EE
IKAnalyzer结合Lucene使用和单独使用例子 简单性能测试
IKAnalyzer是一个开源基于JAVA语言的轻量级的中文分词第三方工具包,采用了特有的“正向迭代最细粒度切分算法“,支持细粒度和智能分词两种切分模式。刚开始使用的时候,发现不能支持中文和字母混合的分词,例如:iPhone5s土豪金。后来发现在2012版本,词典支持中文,英文,数字混合词语,并且优化了词典存储,内存更小的占用。支持用户词典扩展定义。为了更好的测试,这里就使用了IKAnalyzer2012_u6这个版本。
IKAnalyzer
Lucene
分词
作者:arthinking
|
发表于 2014-06-02
|
分类于
J2EE
1
×
帅旋DevShow
订阅及时获取网站内容更新。
充电
当前电量:100%