IT宅
A brief history of the future of AI in education
首页
网络
网络协议
网络编程
存储
Redis
MySQL
架构
重构速查表
架构模式
分布式
Dubbo
消息队列
所有专栏
专栏推荐
查看更多
架构解码:模式与实践
软件架构与模式
JVM速成手册
JVM相关内容
网络协议
详解网络分层和网络协议工作原理
并发编程
并发编程原理和应用
数据结构与算法
数据结构与算法知识详解
重构速查表
重构的相关技能
MySQL
洞悉MySQL底层架构与SQL调优本质
Redis
洞悉Redis技术内幕:缓存,数据结构,并发,集群与算法
大数据
1
【TODO】几个海量查找和去重的问题
// TODO 一个文本中存了10亿条数据,有顺序,怎样最快取出指定的数据? (利用B+树,类似数据库索引) 一个文本中存了100亿行数字,无序的,取出前100个数字。 (hash分成小文件,然后分别构造大小为100的最小堆,对文件进行处理。文件映射内存技术,快速排序,不考虑稳定性,归并排序,考虑稳定性,堆排序) 有1亿条文本,去重。 (布隆过滤器,hash分成小文件)
去重
大数据
作者:arthinking
|
发表于 2014-06-15
|
分类于
J2EE
1
×