IT宅
A brief history of the future of AI in education
网络
网络协议
网络编程
存储
Redis
MySQL
架构
重构速查表
架构模式
分布式
Dubbo
消息队列
精进之路
网络
MySQL
Redis
MQ
JVM
所有专栏
专栏推荐
查看更多
架构解码:模式与实践
软件架构与模式
JVM速成手册
JVM相关内容
网络协议
详解网络分层和网络协议工作原理
并发编程
并发编程原理和应用
数据结构与算法
数据结构与算法知识详解
重构速查表
重构的相关技能
MySQL
洞悉MySQL底层架构与SQL调优本质
Redis
洞悉Redis技术内幕:缓存,数据结构,并发,集群与算法
去重
1
【TODO】几个海量查找和去重的问题
// TODO 一个文本中存了10亿条数据,有顺序,怎样最快取出指定的数据? (利用B+树,类似数据库索引) 一个文本中存了100亿行数字,无序的,取出前100个数字。 (hash分成小文件,然后分别构造大小为100的最小堆,对文件进行处理。文件映射内存技术,快速排序,不考虑稳定性,归并排序,考虑稳定性,堆排序) 有1亿条文本,去重。 (布隆过滤器,hash分成小文件)
去重
大数据
作者:arthinking
|
发表于 2014-06-15
|
分类于
J2EE
1
×
IT宅
关注公众号及时获取网站内容更新。
请帅旋喝一杯咖啡
咖啡=电量,给帅旋充杯咖啡,他会满电写代码!