如何快速检测大数据的完整性?

2014-03-11 17:01:06 +08:00
 lococo
貌似传统的方法如下:
ORIGIN AUDIT
row1 hash(row1)
row2 hash(row2+hash(row1))
···
rowN hash(rowN+hash(···))


其中ORIGIN table里的是原始数据,AUDIT table里的是校验数据,假设AUDIT table里的数据没有被篡改过,那么最原始的办法就是一条一条用hash值去比对,

但是对于大数据这样的效率太低了,有没有什么办法可以快速的校验数据的完整性呀
3219 次点击
所在节点    云计算
2 条回复
binux
2014-03-11 17:42:41 +08:00
确定你的需求,如果要检测任意一位错误,除了全扫一遍别无他法。
Admstor
2014-03-11 17:55:33 +08:00
已存档的数据直接hash文件即可
在线的数据感觉基本上就只能一条条扫了

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/103829

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX