李萌:互联网+交通大数据助推智慧交管

来源:观察者网

2016-09-30 11:00

李萌

李萌作者

清华大学土木工程系副教授、清华可持续交通研究中心执行副主任

由公安部交通管理局指导,公安部交通管理科学研究所、人民日报媒体技术股份有限公司、高德地图、新浪微博联合主办的2016(首届)“互联网+交通出行服务”论坛9月28日在北京召开。本次论坛以“智慧交通、融合创新”为主题,旨在分享创新服务及技术成果,倡导交通管理大数据与新媒体等互联网+手段应用,进一步提升政府职能部门的决策水平和服务社会的能力。清华大学土木工程系副教授,清华可持续交通研究中心执行副主任李萌现场发表演讲:

李萌:尊敬的各位嘉宾,各位专家,各位同行,大家下午好!首先在我开始讲之前,我想说代表清华大学,其实也是今天的协办单位之一,感谢大家的大力支持。我想大家可能没有特别注意到,在众多的主办单位和协办单位之间还有一个是高校。高校今天是少数,我们今天看到了众多的成功案例,前面包括广州、深圳,各地城市,还有北京、天津没有讲到的,我们看到很多成功案例,这些大部分的成功案例里边,我们看到是政府和企业的深度合作。而且今天有幸见证了来自交通行业的管理者和决策者和互联网大咖们,在不断深化他们的合作。

我在祝福的同时想补充几句,其实这个模式里面我们希望看到的是三位一体模式,政府、企业和研究机构。我们看到的时候这里面也为我们研究机构呼吁几句,因为其实今天讲到各个城市,各个主管部门,他们的成功经验,大量成功经验,我们学到了很多。但是其实我们在这个探索过程之中,我们应该看到还有很多问题是我们没有解决的。很多难题是我们需要去解决的。在这里刚才IBM的博士、科学家也讲到了,其实大数据是一个新兴事物,在这里面需要一个深度交叉的多学科,共同努力去解决现在的问题。

那在这里面我也想替我们的学界去呼吁呼吁,我们也希望在政企蜜月期合作过程当中,也把我们研究机构考虑进去。因为一定有那些硬骨头需要去解决,那我们可以尝试共同去面对。今天作为学界代表之一,可能去分享一些我们的理念和一些成果。今天本身不是学术论坛,所有我讲的内容里面,把所有的公式都拿掉了,只分享我们的理念和成果。今天我要讲的主要分四个方面,首先就是去回顾交通管理与服务发展趋势,这个历程。但是这个过程中看互联网+交通大数据的机遇以及挑战,更重要的是他的挑战。以及我们跟众多的合作伙伴,在天津,感谢天津交警支持,我们在尝试努力去挑战的一些技术难点,去做的多元数据融合下的智慧交通信息发布。

最后,我们在尝试一些我们认为有挑战性的一些工作,互联网+智慧交通的应用展望。

我们去回顾交通管理与服务发展的趋势,前面有几个嘉宾其实已经讲到,我们从最早的1.0时代,我们交通供需逐渐开始出现了一些矛盾的时候,我们开始出现了劳动密集型,我们派警力直接局部点,局部时间,早晚高峰进行管理,最早我们采取这种方式,还没有信息手段。发展到2.0时代,这里面一方面是我们供需矛盾进一步尖锐。另外一件事情就是我们信息技术的不断发展,以及我们国家,包括科技部,公安部,交通部一系列的科研,从八九、九五、十一、十一五、十二五到十三五,我们对智能交通计划进行一系列的探索,我们在连续时间内进行智慧化的管理。

随着矛盾进一步尖锐,以及投入进一步增加,我们看到新的机遇。我们现在发展的趋势里边实际上是向着数据密集型,怎么能够更好地把我们密集布设的,花了大量投入的设备更好用起来,让他们数据产生的价值,这些信息,这些知识可以帮助我们智慧化的管理,现在我们进入数据密集型时代,可以在准连续时间和空间进行更有效的管理。在这个发展过程当中,我们大部分城市,虽然我们今天有一个感受,我们前面主讲嘉宾都是成功的经验,会给我们一个错觉,我们真的已经全国大部分交警进入了数据密集型,互联网+的时代。其实对于我们全国大部分城市来说我们真的还没有走到那一步。我们更多城市还是在尝试设备密集型时代所看到的挑战。

我们在部分的城市,部分发达城市,我们看到设备密集型的时代面临的一系列的挑战,我们无法在这个时代进行解决,我们需要有更多的发展,其中包含成本高、效益低的,我们在不断建设我们的设备,我们不可能对城市来讲,在每一个节点布设我们的设备,不可能完全布设,主要原因是在于我们的成本建设费用。

而且更可怕的事情,实际上不光建设费用,营运费用和维护费用在不断持续高涨。我们了解到一些城市,光信息化没有完全铺设的信息化,每年的运营费用中电费已经超过500万,这还不包括通讯费用。这样大量增长的费用使得城市无法承受成本高,效益高的方式。

即使我们有这样的信息,我们这样的数据也存在一定的瓶颈。我们现在检测点的信息存在着位置离散,数据相对比较稀疏,我们数据质量需要校验,数据本身存在一些问题。即使我们获得很好的数据,对于管理部门来说,我们其实还面临一个更大的挑战,就是我们要具备的数据的分析能力。在一系列分析能力,包括多元数据融合,分布式计算,数据挖掘,这些对于我们交警部门提出极高的挑战。单单依靠交警部门是没有办法去完成的,那我们希望看到的就是我刚才提到的政企研所结合的模式。

对于我们如果从数据角度去看互联网+交通大数据,这个时代在3.0的时代给我们带来的机遇,我们这里边看到对于传统管理者数据来说,我们虽然获得了全样本数据,我们某一个断面全样本数据,某一个数据在空间上是离散的,并不是连续的。在这个时候我们看到实际上从互联网+的数据所能提供大量时空轨迹数据。董总讲到提供70%以上的数据,这样的数据实际上对我们离散数据点是一个非常良好的补充。

从另外一方面我们看到,我们众包的数据。众包数据互联网我们用户在不断地大量提供这样的数据,这样数据,海量数据涌进来,其实也有局限性,精度问题,可信度问题,我们怎么样去解决。解决的唯一途径就是我们管理者的数据,我们来自于管理者的小数据样本,权威数据样本。所以我们看到这就像一个交通系统不同侧面,我们看到了可以是一个完美的结合,我们权威的小的精准样本,跟我们海量的粗糙的大数据样本,可以进行有效的结合。这个结合会达到1+1大于2的效果。

在形成准完备的数据还没有让它发挥作用,怎么让它发挥作用,这里面有一个更严峻的挑战,我们互联网+交通大数据融合,实际上在这里面,虽然是机遇,当然更多的带来了是挑战。而我们去总结这样的挑战可以来自于四个方面,多元数据的融合算法,我们现在已经在逐步地尝试数据进行融合,但是离我们真正的特征级以及决策级融合还差的很远。海量数据的实时分析,分布式计算,以及在地T—GIS地图引擎,大数据可视化都面临一个巨大的难题,顺着这个难题进行解读。

首先认为最大的难题,多元数据融合分析?前面研究和尝试已经在做数据融合,更多融合还是停留在数据融合这一层。真正融合我们从数据融合层深入分析各类交通数据的形态和特点,实现多元异构数据,在特征级以及决策级的融合,结合交通实际业务,这里面不光是数据的融合,其实更多是理念的融合。今天孙书记讲到这一点,我们理念融合里面还有理论的融合,我们数据挖掘,人工智能,跟我们一系列的交通理念,包括我们的交通需求预测的理论,包括我们交通流理论,我们交通系统均衡理念,我们交通系统预测理论,这一个结合才是我们交通,多元数据融合一个基础。

在这个层面里面面对海量异构的交通数据,我们从数据融合的层面,包括数据校准,相关性分析,特征级融合方面进行一系列交通事件影响分析。我们做应用之前我们做大量的前期研究,我们拿了北京,包括天津大量的交通的拥堵和交通事故数据,我们去看在交通事故,我们在交通拥堵环境之下是如何发生,如何演变,如何消散的。我们积累大量的这样数据融合的分析结果,才有可能帮助我们进行决策和分析。

另外,我们交通状态的评估。在这里面如果去讲的话,我们交通数据的融合分析一个非常追求的一点,就是做交通预测,这里面有大量交通状态评估和交通状态不确定分析。

在这个特征级融合基础之上,我们才能去做决策级融合。什么是决策级融合?我们做决策不是单一决策,是一个综合决策。这个决策既包括我们怎么样服务于公众出行,也包括我们怎么样有效的管理,还包括我们未来如何进行我们政策制定和规划。在这里面进行综合决策的规划和融合。

在这一系列的融合基础里面,光我们教研组有超过30个发明专利的专利群,就单做数据融合这一项,所以其实这里面还有很深入的一系列的研究和应用。

我们大量数据融合对数据计算提供了要求,我们海量信息进行预算,应该怎么样搭建,建立新的数据存储的构架,重新整合我们的数据源,对分布式计算,分布式存储提出很高的要求。构建实时系统,如何有效的分配资源,以及数据的管理,包括存储、处理以及计算,提出更高的要求。

在云计算的基础之上,对于我们交警部门来说还有一个特别需要考虑的数据安全性。数据是否安全,能否拿出来直接给企业使用,这里面涉及到很多问题,有没有更好的模式?我们也在跟天津交管尝试,用私有云模式,让企业和管理部门共同去开放数据,研究机构作为一个平台,去搭建这样一个互信平台,这里面也做了一些相关的尝试。

大量数据进行计算,如果实现实时的交通运用,搭建交通地图服务的平台引擎,我们要把一系列不同层面的数据进行整合,包括我们地理信息系统,包括我们的管理设施,管理设备信息系统,包括动态交通信息,管理信息,以及我们出行者,我们出行车辆的一系列的信息,在交通地图服务平台上面进行搭建,然后才能实现我们一系列的应用。

另外,非常重要的,可能被很多人忽视的问题,就是大数据可视化技术,我们是否能够通过一系列的展示,比较精简地展示,让用户得到非常满意的使用,跟天津交管部门尝试,以及不同层级的管理者,他们关注的问题不一样,我们团队有一整套的技术进行提供。

在这样基础之上,我们其实组建了一个综合的团队,包括我们研究机构,包括我们政府,包括我们相关面对那几个一系列难点的企业,我们共同形成这个团队,为天津打造多元数据融合下的智慧交通信息发布,这个发布系统里面主要分三个部分,包括我们的地理信息系统的支撑环境,我们网络安全体系,在这个基础之上,我们实现大数据的计算平台,在这个里面我们数据融合、分析、加工,通过不同的渠道进行发布。

比较快的介绍一下系统的特点。其中最大的特点我们是做数据融合,这个数据融合实际上并不是简单地把高德数据或者是互联网数据拿来去使用,我们去综合分析他们与我们管理部门数据有哪些优缺点,有哪些互补地方,这里面看到管理数据来说,存在着交通检测点位置,离散和路况稀疏,不同的时间节点,虽然能够提供连续时间的数据,但是不能提供连续空间的数据,这个时间我们以互联网数据进行补充。

当我们拿到高德数据的时候,也不是完美的,我们高德数据看到,在不同的时间点存在着有些难以区分、交通拥堵问题,有些出现拥堵,不知道是信号影响,还是因为一些事件影响,如果我们能够整合权威数据进行整体优化的算法,那我们可以更准确地进行整个播报。这里面我们融合交通数据信息,地磁信息,交通管理的事件和管制信息,以及我们实时的高德的数据,在这个基础之上我们经过一系列的验证,对整个天津市区进行分布,我们可以看到对18%到25%的空间区域,对互联网数据进行补充。我们在有互联网数据的情况之下,我们通过检测点信息,对精度实现20%到25%的提升,这是我们经过大概三个月的时间刻苦的攻坚达到的提升。对于高德储备几年算法才使显得问题我们进一步提升,这个技术还是应该得到肯定的。

另外,我们融合基础上提供更精准的预测,我们对整个城市交通拥堵进行排名,实施排名,方便我们整个管理部门进行监控。在这个基础上我们也进行对比,不光是说我们去看哪里拥堵,我们去看哪里异常,这个异常指数进行评价和排名,并给予管理部门实施动态的监测,推送PDA也好,这样可以第一时间进行校正和进行处理。

另外,我们也是对多类数据进行互相校验,包括高德互联网的权威数据以及小的数据进行校验。

另外,我们结合跟北方交管合作,尝试做中短时预测,主要是15分钟到60分钟预测,我们中期预测大概就是1天到1周的预测,也是基于我们大量数据融合基础之上,我们对应用数据模式分析,对道路交通预测进行明日、本周、下周预测,对大型活动进行预测,以及节假日的路况预测,跟交管部门有雷同之处。

对于未来我们做了几个展望,一个展望也是包括武汉,包括广州做尝试的,我们做信号控制,信号控制是交通管理非常重要的核心功能。我们做法跟他们不太一样,我们除了应用数据挖掘手段以外,我们基于交通流理论和排队论基础之上,我们对点进行评价。利用大量的历史的轨迹信息,评价每一个路口的表现,既包含因为需求高低所造成的这种表现。也包含因为交通管理控制,信号配时不当造成的不均衡性。而且包含点以及线和面协调,由于配置不当造成的损失,这个评价基础之上做排名。这个排名更多是针对管理部门的职能,我们告诉管理部门哪些配时有最大的空间型调整,管理部门可以从排名最高到往低调整他们的配适方案。我们正在进行实时优化,在天津进行相关的测试。

另外我们尝试用互联网+的智慧交通应用展望,这些基础上定义了交通指数,跟北京交管部门一起评价未来有多少量化需求进行警务调度,以及优化调度预案,这是我们互联网+以及交通指挥方面的调度工作。

以及在长期这些工作里面,包括交通组织,比如说这里面的环岛是否进行设置,潮汐车道是否进行设置,我们建立交通仿真模型,然后进行未来评价,我们也在尝试一系列的工作。

最后讲我们在探索过程之中看到了交通精细化管理对互联网数据,互联网+交通大数据产生的巨大需求,我们相信依托数据融合,数据挖掘分析,地图引擎及大数据可视化技术,这样综合政、企、研的团队,我们可以共同地推进城市交通管理和交通出行服务的未来,我的讲话就到这里,谢谢大家!

责任编辑:刘响
互联网+ 经济数据 大数据
观察者APP,更好阅读体验

明年开工!越南总理:确保中越铁路顺利对接

“若我们曾抱一丝幻想,中国半导体发展不会如此迅猛”

《心智对话》直播:世界科创的旧中心与新势力

12年造20公里,这条日本承建的越南地铁终于投运

沙利文放话:特朗普跟中国谈不成“大买卖”