来源:扬子晚报 作者:徐晓风 发布时间:2016-10-10 10:55:29 字体:[大 中 小]
摘 要:全国公安交管部门已经在新浪微博开通认证了4300余个账号,日均发布微博数量超过1.5万条;公交卡大数据今后可能会抓住城市九成以上的小偷;南京苏州已经成为全国智能出行发展城市十强城市……近日由公安部交通管理科学研究所、高德地图等机构联合主办的“互联网+交通出行服务”论坛上,专家介绍说,未来交通大数据的应用将会给百姓带来更多“不可能”的方便。
全国公安交管部门已经在新浪微博开通认证了4300余个账号,日均发布微博数量超过1.5万条;公交卡大数据今后可能会抓住城市九成以上的小偷;南京苏州已经成为全国智能出行发展城市十强城市……近日由公安部交通管理科学研究所、高德地图等机构联合主办的“互联网+交通出行服务”论坛上,专家介绍说,未来交通大数据的应用将会给百姓带来更多“不可能”的方便。
公交卡信息如何“算出”小偷
根据公交卡的大数据,能够筛选出九成以上的疑似小偷,这是怎么做到的?有参加论坛的专家介绍说,现在我们结合公交车GPS数据、乘客刷卡信息等数据,能够获取每辆公交车每个站点停车时间、上下车乘客数量、乘客精细时空轨迹等,可以做“公交车线路、站点、发车频次优化”、“典型居住区和就业地的通勤出行分析”等分析。
A
验证原理:绝大多数乘客乘坐公交车或地铁出行时,会选择最优出行方案,要么用时最短,要么换乘次数最少;但有极少数人的乘车路线很奇怪,比如会绕行一大圈或者突然改变乘车路线,没有什么规律可言,如果某人的异常行为足够多,那么他有可能是小偷。
B
研究过程:此前发布的这一成果是一项大学教授做的研究,在一次国际会议上公布过成果。以北京为例,研究人员分析了两个月约16亿次公交卡刷卡数据记录,共涉及约600万名乘客。
第一步,研究者把北京划分为居住、工作、教育、购物、娱乐、医疗等多个小功能区块,建立起包括896条公交路线、近4.5万个公交车站与18条地铁路线、320个地铁站的公共交通网络数据集,通过数据建模从庞大的公交卡记录中过滤掉普通乘客。
第二步,结合从警方报告和微博上收集到的失窃信息,通过机器学习算法从异常出行信息中挖掘出潜在的小偷。
实验结果:上述方法中被归为“行为异常”者,之后被确认为小偷的验证率高达92.7%。可是,如果小偷频繁换用公交卡呢?据研究此项目的专家表示,就算换卡也有办法,比如小偷经常团伙活动,这也是一个明显的特征。
C
质疑声音:不过也有人表示,人的活动是十分复杂和偶然的,也许乘客心情不好,或者坐过站回头、临时改变行程等等,都有可能出现行为异常,不能都判定为小偷吧。