yinwang 真的能搞个远超其他数据库的数据库出来吗

2017-09-06 10:11:20 +08:00
 a87150

我现在最感兴趣的一件事情,也是技术难度最高的一件事,就是设计和制造一个全新的数据库系统( DBMS )。在我一直以来的博文里,我已经明确的显示出了对数据库这个领域的风气,以及很多数据库产品的不满。数据库是非常重要,有巨大经济价值,却又被搞得最乱,忽悠最多的一个领域。

从最早的关系式模型和理论,到 SQL,到 NoSQL,到 NewSQL,大数据,图数据库…… 这个领域发明出各种吓人的名词,各种新的查询语言,却没有从根本性的认识到他们在解决什么问题。Berkeley DB 一类的系统上百万行代码,结果到最后发现它解决的问题,其实可以用几千行代码解决,而且速度还要快很多。这说明什么问题?这说明这个领域的人根本不知道他们在做什么,他们缺乏对于计算和语言最本质的理解。

经过一段时间的摸索,我已经窥探到数据库系统里各种概念的本质。实际上的问题,恐怕比几十年来很多人想象的要简单和容易很多。再加上之前从头构造 B+ 树等关键数据结构的经验,这使得我在这个领域如虎添翼。号称当今世界最快的某数据库,里面的 B+ 树代码居然是从别人那里拷贝过来改成的,而且混乱复杂不堪。从我的 B+ 树设计出发,再加上对数据库里面各种概念(比如事务)的重新理解,我将会构造一个极其简单而高效的底层数据库系统。

在此之上,结合我对程序语言和编译器的深刻理解,这个数据库将拥有一个极其简单而强大的查询系统,用以解决远程访问和多机构架的需求。这个数据库不是 SQL,也不是 NoSQL,也不是什么 NewSQL。它只是把数据库还原到它本来应该是的样子,恰到好处的解决问题。

谈到分布式数据库,我不得不指出,分布式系统也是一个很混乱的领域。其中充满了各种像 Paxos 一类糊涂而没人讲得清楚的理论。Paxos 的论文被评委拒了三次才投稿成功。按照我的标准,这种故意把问题搞复杂的论文,根本就不应该让他发表。我非常的不欣赏这篇论文里面所谓的“幽默”,一点都不好笑,还把问题弄复杂了。

最近有人发表了 Raft,才稍微好一点,然而里面还是遗留了许多不必要的复杂性和 Paxos 留下来的历史思想包袱(像状态机一类的东西)。我的另一个目标就是消化和转换这类分布式系统理论,使得它们大大简化,用以扩展底层数据库,而得到分布式的扩展和可靠性保障。

这是一个相当大规模的计划,包括了大量的研究和实现工作,所以可能会花不少时间。当然,最后的代码应该不会很长。我的目标,是建立起一家可以跟 Oracle 匹敌的数据库公司,统一和简化互联网领域和其它新兴领域的数据库应用,并且蚕食银行等传统领域的数据库市场。

我已经跟一些数据库领域的内行进行了关于数据库本质的探讨,我也欢迎对此感兴趣的其它人士跟我讨论。

http://www.yinwang.org/blog-cn/2017/09/05/plans

9852 次点击
所在节点    数据库
108 条回复
maddot
2017-09-06 17:14:27 +08:00
不如做网红开收费课程走向财富自由之路
owenliang
2017-09-06 17:14:52 +08:00
我觉得他和知乎上写段子的好像一路人。
XiaoFaye
2017-09-06 17:26:17 +08:00
做出来 跟 成为成功的产品 是两码事,另外先进的东西不一定是大家都认可的
simapple
2017-09-06 17:28:46 +08:00
悬 不是没能力,而是做了一半,就会 xxxxxx 然后去 tmd 的数据库,项目 over
YenvY
2017-09-06 17:31:49 +08:00
有点想看围脖那个叫 zhh 的会怎么说 ww
uuweZhou
2017-09-06 17:37:58 +08:00
他但凡了解数据库一点

就会知道他是多么自大了
FanWall
2017-09-06 17:40:51 +08:00
太有性格的人的产品不敢用,加油
maddot
2017-09-06 17:41:00 +08:00
我觉得他还是趁热潮还在,组个小团队上线个网站教人撸码赚一笔吧....
deadblock
2017-09-06 18:09:12 +08:00
有谁知道 yinwang 的个人邮箱,我去炮轰一下我的偶像,嘻嘻
hjc4869
2017-09-06 18:17:51 +08:00
不能
Wangxf
2017-09-06 18:19:30 +08:00
说实话,真的很羡慕王垠这种与生俱来的自信,希望不要烂尾,让一众粉丝失望
ThinkCat
2017-09-06 18:24:34 +08:00
talk is cheap
nVic
2017-09-06 18:24:41 +08:00
不能说是不可能吧,那样显得太狂了,不太可能吧。
youxiachai
2017-09-06 18:31:37 +08:00
这个其实是为后面的 B,C 计划做铺垫的.....
建议看完再评论....
ryd994
2017-09-06 19:23:06 +08:00
yinwang 的理论水平是有的我不怀疑
是不是学界第一,呵呵
理论水平好就一定能做出好产品,呵呵呵
有个好产品就一定能创业成功,呵呵呵呵
论扯大旗画大饼,他还是该向创业圈学习一个

其实全篇都是废话,只有一句重点:“我的目标,是建立起一家可以跟 Oracle 匹敌的数据库公司,统一和简化互联网领域和其它新兴领域的数据库应用,并且蚕食银行等传统领域的数据库市场。”

个人认为 Raft 的学术价值比不上 Paxos。Paxos 更多的是对于分布式共识的机制,的理论模型的讨论。至于能不能实用化,适不适合数据库应用,这根本不是重点。而 Raft 只能算 Paxos 的一个简化版,更容易实现,也满足分布式数据库的需要。然而,普适性更强的理论更有学术价值,不是吗?
jameshuazhou
2017-09-06 19:29:03 +08:00
SQL 后面站着关系代数,干掉 SQL 后,还要发明个数学来干掉关系代数。
B+树对数据库很重要,但不是全部,PQ 的代码够优秀了吧,但还是被 MySql 压地上摩擦。
分布式的复杂性是固有的,状态机是目前最直观的建模实现方式了,吾等凡夫俗子真想象不出还能怎么简化,期待中。
相信 yinwang 的能力和审美,但这个世界不仅仅有诗和远方,还有大量的坑要填。
akring
2017-09-06 20:09:03 +08:00
不想评论,show us the fxxking code
rogwan
2017-09-06 20:16:35 +08:00
总的来说,在技术领域忽悠还是最难的,高下基本上能做到立判,比起政经文艺领域好多了好吧。这两天那个 00 后分分钟被脱光,这种事情要是发生在文学领域,可以吵几十年而没有定论。

淫王能吹这个牛,还是期待发作品的
sorra
2017-09-06 20:22:38 +08:00
难度高,但也有意思,很有成就感。
但是列出这么多计划,计划越多成功率越低
Madkill
2017-09-06 22:30:54 +08:00
看起来很厉害的样子

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/388521

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX