得到一个站点的所有 url,如何反推出站点的路由规则

2016-04-07 16:58:11 +08:00
 amlun
RT
模式匹配?
2705 次点击
所在节点    Python
3 条回复
UnisandK
2016-04-07 17:03:49 +08:00
自动总结规则?这是神经网络的范围了吧
menc
2016-04-07 17:13:19 +08:00
通过后验概率判断先验概率,
你想要知道的是:

已知 http://aaa.com/a/b/c 的出现概率 是 P(x), 在 X 事件发生的前提下 http://aaa.com/a 是路由规则前缀的概率是多少, http://aaa.com/a/b 是前缀的概率是多少 http://aaa.com/a/b/c 是前缀的概率是多少,取概率最大,就是这个 URL 的路由前缀

这个东西叫做朴素贝叶斯
amlun
2016-04-07 17:20:16 +08:00
另外可能还需要根据 URL 对应的页面内容作为判断依据。。

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/269304

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX