Toggle navigation
博粹
首页
博文
作者们
关于
最新
热门
搜索
搜索
分享
存储中的文件合并策略优化
2018-11-04
张炎泼
storage
minhash
similarity
compact
algorithm
问题 系统中的所有数据以block 存放: 每个block里: 有 n=1000万个文件, 已经排序好, 每个文件名长度平均l=512 Byte. 2个block中可能包含大量的重复文件, 这时我们需要找出这2个block, 将其合并, 以节省空间.
继续阅读 »
×
分享链接
上一页
下一页