有没有一种更好的方法能够发现套牌车辆?

2014-11-03 20:29:34 +08:00
 mlhadoop
目前拿到的数据是某个地区一天内经过某个检测点的车辆信息(检测点名称、车牌号码、瞬时车速、监测点经纬度、通过时间),想要实现对套牌车辆的分析。。
暂时的想法是通过时间-距离上的差异来得出异常的车牌号。(比如A到B距离100km 平均时速50 那么2个小时可以到达 但是从数据中却发现 半个小时之内检测到车X分别在A 和B出现过 那么我们认为他有可疑。。)这只是初步的想法,其中有很多的问题,比如这个平均速度会根据不同地方而不同不知道如何设定。。

请各位v友 不要吝啬你们的想法 让我们风暴一下吧。。。
5037 次点击
所在节点    奇思妙想
31 条回复
Keinez
2014-11-03 20:39:00 +08:00
没理解你“车X分别在A和B出现过”的思路。

不是程序员,说个想法:
根据监测点绘制车牌的运动路径,假设套牌车辆A在路上换成车牌B,那么可以得出车牌A或B的运动路径较正常车辆要短。
semicircle21
2014-11-03 20:46:52 +08:00
其实我觉得基础算法你已经想得很清楚了, 你想要的大概是一些工程性的思路:

如果糙一点, 可以把车速参数设置的非常高, 比如 200km/h, 这样会漏过一些套牌车, 但不会误杀.
如果细致一点, 你可以将 N 个监测点之间的消耗时间都算出来, 不知百度高德谷歌地图的 API 能不能帮到你, 就是搜索线路时, 经常会给出"全程耗时1小时40分钟"这样的数据.

然后是要实时发现还是事后分析?
mlhadoop
2014-11-03 20:47:24 +08:00
@Keinez 不好意思 说的不够明白 意思就是在很短的时间内我们发现同一个车牌号出现在了距离很远的两个地方(重常理上来说基本是不可能的,那么无非就认为有两个同样的车牌号码同时在行驶而且被派到了咯。。那么这两个就至少一个是假的吧,当然也不排除两个都是假的啦。。。总之我们就得出这个号码比较异常了。。不知道我将明白了没。。嘿嘿)
mlhadoop
2014-11-03 20:52:36 +08:00
@semicircle21 谢谢 这个暂时还没有要求实现实时分析 可以经过离线分析 得到这些认为有异常的车牌数据就可以了 查过百度的lbs 有提供一个相对自己计算 精确一点的值 的接口 ,具体还没有计算最终的效果 现在只是想有哪些解决方案 然后针对大量的这些数据如何构建这么一个模型。。再次感谢
Keinez
2014-11-03 21:05:29 +08:00
@mlhadoop 对,但是同一个城市里,套牌出现相同号码的几率很低吧。就算在全国也会有所套牌号并不重复的情况。检测号码重复在我看来并不是一个好方案……
mlhadoop
2014-11-03 21:33:20 +08:00
@Keinez 这个情况也不算少 目前没有一种较好的检测方式 大部分是群众举报录入数据库的
mikelaile
2014-11-03 21:42:25 +08:00
难道你只有一个监控么?如果同时两地出现了同样牌照的,当然是套牌了。
uuair
2014-11-03 21:49:48 +08:00
看时间啊,同时出现就是套牌。。。我就是这么被抓的,还有,对照行驶本的颜色
Pactzhao
2014-11-03 22:23:09 +08:00
@uuair 你就是这么被抓的...
yangyanggnu
2014-11-04 01:08:03 +08:00
我觉得从时间而不是从距离考虑更直接些。具体而言,0)以车牌为主线,车管所有所有车辆车牌和车型(包括颜色)的对应关系,所以,一旦发现不一致则视为套牌,这可以抓出大部分套牌情况;1)同个车牌同一时刻(或者较短时段)不可能出现在不同地点,所以对于那些同个时刻不同地方出现的同个车牌视为套牌。这两种情况加起来基本都能抓出来,除了一种情况:我和小王买一样的车型,我再办一个和小王一样的车牌(套牌),然后我还知道小王长期不用他的车,这时,上面说的两种情况是抓不到我的,但都已经套牌了,在心理上,“反正扣的不是老子的分,怕毛”,所以,2)针对违章次数较多的(定个阀值),人工介入核实是否套牌。

即便这样还是有很多不可控因素,比如,车辆信息是否全国联网、天网覆盖区域是否完善、回收车牌是否重新入市等等。

不好玩。
pimin
2014-11-04 04:38:08 +08:00
我觉得这不是一项即时任务,应该是属于长期优化型,宁可放过1000,也不错杀一个。时空跳跃是最准确的判断依据,但是不是筛选依据。
不应该做每辆路过车辆都对所有数据进行时空跨度计算,1.是效率太低,2.是套牌车只是正常车辆里非常非常少的一部分异常。

说白了更像是大数据挖掘,从海量的信息里提取概率非常小的套牌车辆。我给的建议是,更多的考虑统计学。

首先做的应该是筛选工作。对整体数据进行统计,对多种数据进行分别统计,找出异常部分,维护多个警报列表,对列表上车辆进行每次时间统计,达到x次异常则输出至套牌车辆列表。

异常方面来说,要考虑的因素非常多,比如统计每天/月通过监测站数量的前3%,开始的时候肯定是都是出租车啊什么的。警报列表基本无效。我要说的是对这个列表进行长期维护,做好白名单移除工作,判断方式可以是对时间跳跃的验证,也可以是其它任何方式。
随着时间增长,可能白名单会越来越长,定期对白名单进行监测和更新迭代。使其维持在一个动态平衡的长度。
loading
2014-11-04 09:08:52 +08:00
如果将高速路出口收费信息发送到车主(根据车牌),就可以将这个识别运算量分配到每一名真正的车主。

PS:请点感谢
vincentqi
2014-11-04 09:28:59 +08:00
方法1. 拍照的时候做图形识别,判断车辆外观特征,数字化后与车牌号一起存入数据库。号码相同外观不同的,基本就是套牌的。
方法2. 监控拍照的时候做人脸识别,与行驶证上的人脸进行比对,驾驶人与行驶证人脸不同的,列入可疑对象。
lijinma
2014-11-04 10:05:28 +08:00
@loading 这难道不是最好的方法吗????
won
2014-11-04 10:34:46 +08:00
是否一定要指望摄像头图像比对?
我们知道摄像头启动前,会有一波雷达感应。我假设在真的车牌上内置芯片,雷达对于假车牌就可以直接侦测出来。假如是在真车牌上套某一个字母,是否可以通过选定某种穿透性不强的波,造成接受不完整或不稳定来判断
Shazoo
2014-11-04 10:56:04 +08:00
我觉得lz的思路本身就是最具操作性的思路。

根据两条监控记录的时间间隔、路况、时间段、摄像地理位置间距,得出异常数据。然后对异常车牌重点监控,人眼判断,然后抓捕。
semicircle21
2014-11-04 11:22:41 +08:00
@mlhadoop 很多好思路啊, 请给大家点感谢,

楼主应该把 "套牌" 再准确定义一下, 我理解的套牌指的是: 复制了全套的同一车型同一外观颜色另一辆车的牌照+行驶证, 路上碰到交警检查都完全查不出问题, 如果不违章的话, 原车主都不知道, 这种操作方法特别适合限牌照的城市, 比如北京,上海.

高速入口的方法有点问题, 出远门时换真实牌照就行了, 平时在市里接着用套牌.
无论什么方式, 如果是为了应对市里限行, 朋友间商量好的套牌, 我估计这种事后分析都查不出所以然来, 因为完全可以抵赖的..
vincentqi
2014-11-04 11:49:10 +08:00
@semicircle21 可疑看车架号
semicircle21
2014-11-04 11:53:48 +08:00
@vincentqi 嗯, 其实我也想到了, 所以我说是根据视频事后分析, 如果被交警现场按住才能看车架号
mlhadoop
2014-11-04 16:48:18 +08:00
@pimin 谢谢 确实不是一次性完成的任务,我们只是希望能够重大量的数据中进行分析得到哪些可疑的号码 然后交警可疑拿到这个数据进行人工检测 真的就过 假的就check出来了 时空跳跃这个词用的好。。。至于根据统计信息如何检测异常又是一个大方向了 lz得好好恶补 再次感谢

这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。

https://www.v2ex.com/t/143703

V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。

V2EX is a community of developers, designers and creative people.

© 2021 V2EX