杨正:科技被视为中国人利益实现的最大公约数 ,这是最好的时代

来源:观察者网

2019-10-23 07:24

杨正

杨正作者

工业党,宇视品牌部部长

2019年10月20~22日,第六届互联网大会在浙江乌镇召开,宇视科技的视频安全设备,已经是第六年守护乌镇。

此次,宇视在前台部署4000余路智能前端设备,中台为IMOS8.0操作系统和丰富的多方业软,后台包括通用计算、智能分析、融合存储、网络安全等硬件,值守乌镇全区、乌镇景区、主会场乌镇国际会展中心、“互联网之光”博览会新展馆等全部重要场所。

每年各国政要和五湖四海的嘉宾、世界上最先进的互联网技术汇聚在乌镇,宇视的设备可以说是把乌镇大会的情况看得最清楚、最彻底的。观察者网日前采访了宇视品牌部部长杨正,进行了一次“观察者”对“守护者”的交流。

【采访/孙珷 编辑/程小康

观察者网:六届世界互联网大会,宇视的视频设备,已经守护了乌镇6年,这6年里,采用的技术和部署的规模有什么变化?

杨正:6年间,宇视在乌镇部署的系统架构不变,产品技术在不断迭代更新。宇视在2006年推出的IMOS操作系统,是为超大规模城市级环境设计,作为底层平台经受过最严苛的考验:在2016年的G20杭州峰会实战中接入超过10家厂商、不同品牌摄像机的30万路视频,运行丰富的业务,海量数据并发,同时满足数千个用户接入,并行处理上万业务请求,始终保持稳定运行。所以IMOS是有着强大商业生命力的专业OS,乌镇的底层架构就采用IMOS全交换架构,从2014年~2019年间摄像机点位不断增加,服务器压力不增加。

6年间,随着乌镇景区、展馆的不断扩建,宇视的点位在规模上由第1届世界互联网大会时的1200路增加到第6届时的超过4000路,在技术上:

前台摄像机从普通高清摄像机衍生出AI感知摄像机,例如人脸识别摄像机、机非人全结构化识别摄像机(指机动车、非机动车、行人)、人脸通道闸、客流统计摄像机、密度统计摄像机、带温湿度和PM2.5检测功能的物联网摄像机等全新形态。

中台在IMOS上增加丰富的业软,实现了AR全景指挥,界面的直观和友好度上大家可以想象类比操作《红警Ⅲ》,使用者用最少的点击找到最重要的功能,丝般顺滑也是专业软件的用户体验追求。

后台服务器从底层平台,“昆仑”这样人工智能旗舰级的核心大脑,向多业务、智能化、物联网的多业务演进。

观察者网:今年超过70个国家和地区的企业代表、学界代表、政要等1500位嘉宾在乌镇聚会,这样安保级别的盛会,在摄像机的安全部署上有哪些讲究?

杨正:“摄像机”是大众眼中视频系统最醒目的部分,其实在室内还有网络、存储、平台等重要设备,近年来又增强了AI和大数据、安全设备,共同构成一个完整高效的视频安全系统。

相对于在居民小区、商场超市的小型视频安全系统讲求易用,劳动者能最简单学习就可以操作,专业的大型系统在部署有几点不同,主要围绕可靠和安全:

部署在视频专网系统中,专网专用,区别于民用系统有时会使用公有云;核心服务器采用宇视IMOS操作系统,有效杜绝采用通用操作的病毒感染与第三方攻击;在核心网新增部署“燕山”IAC安全准入网关,对所有摄像机进行IP/MAC认证,避免黑客从边缘网络进入;如果采用“幻影”方案,黑客即使获得视频,也只能看到马赛克。

对于公众关心的查看权限问题,有着严格的分级调用规章,公民查询时需要登记必要手续或在公安机关备案以兼顾便利和风控。系统配备安全审计后台,所有操作留有记录。

核心设备如“昆仑”AI服务器、大数据服务器的部署,可处理30亿人、车、非机动车的结构化以及半结构化数据;以及一些最尖端AI全景感知型摄像机的使用。

为使乌镇保持淳朴古貌,宇视部分点位的摄像机连外观设计也使用低可视的迷彩涂装,配合海豚型曲线和谐融于古镇背景,这一点要求在其他项目中很少见。

类似乌镇这样的顶级项目和实战场景,是锤炼最佳技术、服务的场所,可以说是宇视“精工之路”的源泉。

观察者网:能否介绍一下在乌镇的AIoT实验室会进行哪些人工智能、物联网试验?有没有一些有趣的场景?

杨正:宇视在乌镇设立AIoT实验室是一个最自然的结果,有助于技术试验、方案调优和学术研讨:

首先,是乌镇景区距离我们的智能基地仅15公里、客户也有采用最先进的技术装备的需求,联合打磨方案理念,互动反馈和调优改进便利,加速技术从设想到落地。

2018年起,宇视在桐乡(乌镇的上级行政区域,一个宜居和追求制造升级的城市)建成全球智能制造基地。乌镇使用了“昆仑”智能分析服务器、“函谷”AI摄像机、“潼关”人脸速通门,宇视的AI产品均以中国的关山命名,好的AI应用本身就是摸石头过河,在打磨中获得规模部署的经验。包括宇视刚刚获得意大利A’设计奖,采用猫头鹰仿生设计的四目全景摄像机属于“函谷”系列(是具备结构化能力的AI相机家族,多种外观和功能适配不同场景),也率先在乌镇得到应用,下图的增强现实的指挥场景就是由这款摄像机配合实现的。

智能全景摄像机和AR实景指挥系统下的乌镇夜景(细节信息已脱敏)

其次,乌镇作为一个环水小镇,出入口相对规范,天然是高等级安全和人工智能、物联网试验的最佳场所。

好的AI不打扰公民、不被游客感知,除了现在已经日趋成熟应用的人身安全、客流疏导外的机器视觉外,是否能为游客提供便利服务的体验:当一位游客走进乌镇的商店,包括面部表情(肌肉变化)、语音表情(声调、节奏、速度)、姿态表情、语音和文本情感,AI能否帮助双方做更好的理解、沟通、互动,而非在欧洲媒体所记录的“大妈购物”那般双方彼此不理解、隔膜与冲突,多模态情感计算是目前情感计算的研究热点。

经济的跑马圈地和人口红利时代即将结束,个性化需求来临,很难再拓展增量市场,沉淀忠实用户。每个经营者都在被千人千面包围,趋势是更挑剔、更善变了,只有AI才能破局这些人工难以捕捉的场景,好的体验能够刺激营销,带来粘性、赢得增长。当然这其中也伴随很多挑战,比如隐私的界限,这恰恰就是此类研究的价值。我们在和中科院自动化研究所(人工智能研究论文量全球第七)的同志交流的时候,对类似这些场景研究都很兴奋。

情感计算是下一个有前景的AI应用,通过对人类面部表情、语音表情、姿态表情、生理表情和文本情感的获取、分类和识别,可以及时获取目标对象的情感变化

再次,乌镇自身就是世界上最先进技术汇聚的地方,从她建设使用的互联网、人工智能、物联网等技术和应用,以及聚齐山水田林湖等中国人对居住、办公处所最高的园林元素追求,所以不仅作为学术研讨的举办地非常适宜,也在成为各家企业较劲、争雄的处所,是华山论剑的现实版。在每年3月,我们都会以“宇视乌镇AIoT峰会”开放迎接各国来宾、学者和业界厂商,定期发表宇视研究院或多方联合研究的成果,希望这个会议有一天也许能去掉“宇视”的字样和元素,成为一个学术和业界彻底共办共创的思想会、产品会,一起为中国的科技基础研究添柴助力。

最后,桐乡是一个有工业党魅力的城市,她真正的魅力招牌是:招商局长微信名为“业务员”,服务精神媲美宇视团队的客户导向;普通市民在BBS和言谈能数据比较工业强市,上进气质猛进如潮;作为四线城市争取了自己的高铁站;丈母娘们甚至喜欢招公务员做女婿,因为政府管理能帮助摒弃社会潜在的坏习气……和桐乡联合建设宇视智能基地的时光里,我们深深爱上这里。钢铁时代的克虏伯之于埃森,AI时代的达特茅斯之于人工智能,酷炫体验的库柏蒂诺之于苹果,也希望中国能有类似“技术+地区+企业”的区域品牌案例突破,宇视·乌镇AIoT实验室就是这样一个探索,有助于中国开启人工智能规模建设,人工智能快速摆脱概念,以产品、方案、工程化,加速落地和应用;同时为AI基础研究红利消耗殆尽的现状,破局寻找新的方向。

观察者网:什么是城市级视觉数据智能中枢?实现这一概念将给城市生活带来哪些影响?

杨正:我特别咨询过这一体系的设计者管蓓,她在世界互联网大会“桐乡发布”揭幕了《城市级视觉数据智能中枢》,她是我们10年前推出自研摄像机的研发巾帼,今天是宇视智慧城市部部长。

智慧城市1.0阶段,各部门单位各自展开信息化系统的建设。中国原有的IT部门都是建立一个一个的“烟囱”,烟囱式架构也就是垂直的体系结构,每一个IT系统都有自己的存储和IT设备,以及独立的管理工具和数据库,不同的系统不能共享资源,不能交付和访问,形成了资源孤岛和信息孤岛。智慧城市2.0阶段,充分融合各部门数据,构建统一平台。智慧城市3.0阶段,以数据新要素为驱动,以AI等新技术提升供给能力,以新基础设施为支撑,以新服务为根本,以新治理为重点。面向城域的视觉智能中枢:

一方面是模式创新,解决的是传统城市由各业务条线自行建设图像采集与应用系统,转变成面向城域汇集各部门已有公共视频资源,或统一规划建设新视图资源,构建中枢能力和开放共享能力,从而避免城域级视频重复建设的问题。

另一方面是业务创新,体现在视图数据汇聚后的智能的赋能,传统视频更多的是事件发生后被调用,现在通过智能赋能,可以实现摄像头或中枢自动从视频中自主发现问题,自动化地智能派单,快速进行隐患排查闭环,从而避免事情升级,达到防患于未然的效果。总而言之,城市视觉智能中枢是智慧社会,以视觉为核心的城市新型基础。

观察者网:人工智能与城市安防结合后,系统更复杂了,是否会引入更多的不确定性,比如黑客这些非传统的安防挑战?

杨正:负责预研的宇视首席网络科学家周迪指出,人工智能对城市的引入存在四点安全挑战:

第一点,脆弱性。目前的人工智能算法具有场景和语境相关性,只能在算法所匹配的场景和语境之下运行。一旦场景出现变化或超出一定的范围,算法将无法有效应对。安防(包括赛道升维后的AIoT)场景复杂多样,即使是相对成熟的道路交通场景的车牌识别,遇到非本国的车牌,就会出现因缺乏对应类型的车牌样本训练而无法识别。

安防(今天叫做AIoT智慧物联)行业,技术吸纳能力很强,从IP、大数据、机器视觉、边缘计算,都是规模落地应用的先行者;星光、智能等黑科技,也在这个行业成熟与价格“白菜化”

第二点,不可预测性。对于目前流行的基于深度神经网络的人工智能,人类无法预测它将会发生行为,有可能会给出与设计者初衷不同的决策。在具有自处置能力的边缘自治系统中,存在一定的风险,需要严格限制其处置动作。例如出入口管制,可以基于判断不抬杆,却应谨慎实施基于判断快速落杆拦截车辆或行人,有可能造成人财物的损失。

第三点,弱可解释性。基于深度神经网络的人工智能具有不可解释性,因此,人工智能帮助人类做出的决策也让人无法理解其推理逻辑。例如公共安全管理中,通过人工智能识别一个人的行为异常,人们无法理解其判断异常的具体逻辑,这会给管理带来一定的困惑。

第四点,机器学习漏洞能被潜在利用。在对抗攻击中,利用人工智能行为方式的某些漏洞,可输入有害数据发起攻击,目前尚无法有效抵御此类攻击。安防的应用场景面向公共场合和互联网,客观上增加了攻击的便利性。

观察者网:作为一个从事相关行业多年的老兵,你觉得中国建成人工智能物联网社会还要多久,理由是什么。5G+AI+IoT的同步性如何,这三者会一起成功吗?

杨正:吴军先生观察,人工智能技术20年内不会有大突破,因为今天的人工智能已经用光了40年来所积攒的技术红利。但是就像《三体》中所描述的那样,人类科学虽然被智子锁死,技术层面的应用创新还会层出不穷,尤其在技术的跨界组合上会产生新的火花,使得成功的场景有更好保证。

AIoT(智联网,万物智能互联)=AI(人工智能)+IoT(物联网)。关于AIoT+5G最乐观的预期,将是下一代超级互联网。人、车、社会能够更好互联,跨场景、跨设备、跨平台的智能系统,同时赋能百行百业。

对于应用业务,5G的潜在成功有其“行业刚需”的一面,比如4G网络发展10年,各类app平台调优已近极致,软件形态发展相对固化,追赶者在技术成熟期或停滞期能够追平,原有的头部软件企业也呈现大者恒大;5G的出现,为app新形态的改变、后来者弯道超车提供了一个理论通道,因此很多类似的行业的领先者、追赶者角色都在翘首期盼。同时,任何技术在商业上的成功都有成熟阶段、成本前提,例如在视频安全领域,4K出现多年普及尚有障碍,原因在于H.265因为有高昂的专利费阻碍了普及(与此对应,H.264近乎免费),而1080P进行AI分析已经满足绝大部分的场景,普及受阻又没能促进摄像机等终端上量而价格下调,5G和AIoT的结合也要警惕此类陷阱。

对于商业,行业内面临赛道升维,如何能在新一轮技术浪潮里把握住新的趋势,才能形成市场客户所接受的新方案,就会形成新的格局。5G、当前的弱AI阶段,的确是工业革命、电气革命以来一个比较重要的科技发展坐标。但是在基础研究层面,西方和中国都有停滞的现象。它就像罗马过于追逐葡萄酒的醇美和洗浴的舒适,以及南宋过于强调一件器物的精美,当一个社会失去了积极扩张,开始走向内卷化的时候,整个社会是进入停滞的,科技也进入大停滞,从全球十大互联网企业的的电商、酒店、外卖等主业可以看到这种趋势,大国重器则掉落。

对于人类,我个人一直以最乐观的角度看待当前地球上当前的裂痕——期待揭幕一个你追我赶的伟大竞争时代。大约1990年,我小升初时在街上跟同学谈的是火星、哈勃望远镜,谈论的是什么时候冲出太阳系,这是久违的语境。自1988年邓小平在全国科学大会提出“科学技术是第一生产力”30多年以来,媒体乃至全社会从未有像2018~2019年的今天这般热情投入到关心中国科学技术发展的话题上来,一起构建出公众与科技的拟态环境。科学技术被视为全体中国人民利益实现手段的最大公约数!这是从事研究与开发工作人员的幸事,一个最好的时代正在到来。

本文系观察者网独家稿件,未经授权,不得转载。

责任编辑:柳叶刀
宇视 视频安全 安防 互联网大会 AIoT智慧物联 挑战
观察者APP,更好阅读体验

美方对俄隐瞒了部分信息?克宫回应

这条中马“一带一路”重点铁路项目 “或延伸至泰国”

国防部表态:中方不会在南海问题上任菲胡来

关于ASML出口管制,荷兰首相在华表态

警惕!“隐秘”的调查暗藏国家安全风险