python下有没有好用的规则引擎呐?

2013-08-06 23:46:08 +08:00
 sujin190
现在想要从大量数据中按一定规则抽取符合规则的数据,想使用python开发,有没有适合的规则引擎啥的呢?虚心求指导
9716 次点击
所在节点    Python
7 条回复
crazybubble
2013-08-07 02:15:43 +08:00
不如按照规则制定一个feature pipeline吧, 每条数据过一下这个pipeline,返回一串feature vector,然后这串feature vector可以反映数据符合规则的程度。比如假如你有规则A和B,数据d1,d2,d3. d1可能满足A不满足B;d2满足B不满足A;d3满足A也满足B。这样可以表达他们成:
d1: [1,0]
d2: [0,1]
d3: [1,1]
xdyl
2013-08-07 06:40:21 +08:00
除了Java的Drools么发现任何好用的规则引擎
sujin190
2013-08-07 17:38:49 +08:00
@crazybubble 这个不行啊,现在有近千万条数据,有必须在很短的时间内完成,同时每时刻都生成新数据,要定时重复过滤才行,每条过滤肯定不行啊
sujin190
2013-08-07 17:40:14 +08:00
@xdyl Drools是不错,但它能实现对数据进行计算再判断吗?
luojun
2013-08-08 10:59:00 +08:00
我用过VisualRules规则引擎,可以直接在规则中操作数据库,然后使用RuleExecuter来定时执行,设置为5秒钟执行一次,或者设置为每天的00:00执行一次,你说的很短的时间,大概是多长时间呢?因为这个跟你的规则复杂程度也有关系,我曾经试过在规则中从数据库读取200万左右的数据,然后中间经过规则处理也会生成200多万条中间数据,最后在规则中再将数据写回数据库,大概花了5分钟左右的时间,当时用的个人笔记本电脑,
xdyl
2013-08-08 13:56:20 +08:00
@sujin190
没明白你说的数据再计算是指什么。
xdyl
2013-08-08 13:58:15 +08:00
重新看了一下你的要求。
如果规则会变的话,用Drools也可以。

如果有推理过程的话,用Drools也合适。

如果规则不会变也没什么中间数据。还是直接写代码吧

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/78239

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX