设计一个算法给一周七天的拥堵情况排序

2021-04-30 18:16:55 +08:00
 hard2reg

以杭州为例,官方公布了历史数据,但是只能调取一个月前的数据。

http://www.hzjtydzs.com/index.html

官网每 5 分钟记录一次交通情况(拥堵指数),并把交通情况划分为以下五个级别

拥堵指数在 0 至 2 之间为“畅通”,2 至 4 之间为“基本畅通”,4 至 6 之间为“轻度拥堵”,6 至 8 之间为“中度拥堵”,8 至 10 之间为“严重拥堵”。


我的想法

以一个月多一点的数据为参考(因为一个月不可能正好 5 周整,或者就用 4 周的数据)

找出每天每五分钟拥堵指数大于 4 的,计算每天的积分,积分越高每天拥堵越严重

积分算法(每五分钟拥堵指数为 x,积分为 i):

8<x i+3 6<x<=8 i+2 4<x<=6 i+1

积分 = i / (出现的大于 4 的次数 * 5 )

把每个周一的积分相加 /4 或 5,以此类推

最终得到 {'mon':a,'tue':b,'web':c, 'thu':d, ...}

降序排序


但是觉得可能自己的算法并不是很科学,想看看各位帅哥大佬有什么建议。

1000 次点击
所在节点    问与答
6 条回复
zxCoder
2021-04-30 18:20:35 +08:00
(按照一个星期的每一天分组,把拥堵指数求个和不就好了
liprais
2021-04-30 18:26:25 +08:00
你已经有了一个向量了,计算他们之间的距离就完了
hard2reg
2021-04-30 19:02:21 +08:00
@zxCoder 一语惊醒,我的积分算法似乎是脱裤子放屁
hard2reg
2021-04-30 19:07:57 +08:00
@zxCode 假设不去计算 4 以下的(因为都是畅通),周一有两条,5 分钟 4.1 和 5 分钟 4.2,周二只有一条大于 4,5 分钟内堵车指数为 8.3,那怎么判定哪天更堵呢,是一样堵吗?
zxCoder
2021-04-30 22:55:25 +08:00
@hard2reg 感觉这东西都是主观认定的吧,就像机器学习数据集人工标注一样
hard2reg
2021-05-01 01:11:39 +08:00
@zxCoder 是的,我现在改为 根据整个月的数据分析就看堵车概率,根据每周数据分析的就看堵车严重程度(堵车指数),因为如果一个月里有节假日看堵车指数是没有意义的(属于偶尔出现的非常规数据)

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/774416

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX