谢耘:人工智能技术的本质与系统性创新的意义

来源:作者赐稿

2018-07-15 11:28

谢耘

谢耘作者

北洋电气集团首席科学家,首都科技领军人才

任何事物只有放在它所存在的环境中,才能准确理解它的本质。今天,大数据、人工智能等概念由于商业炒作等多方面的原因,已经变得模糊不清了。许多具体的技术也被罩上了夺目的光环,或有意被赋予了能够引发奇妙想象的名字,如“深度学习”。

下面,我们来看一下信息技术产业中的不同要素,在从科学到应用的这个链条上,各自处于什么样的位置。为了不陷入不必要的细节而又能揭示本质,我们将这个链条分为五个环节:科学原理,基础共性技术,具体应用技术,基础系统原理/技术及具体应用系统,见图1。

图1 从科学原理到应用系统,图片来源:作者供图,下同

科学原理是对基本运动规律的认识总结,而技术是对规律的运用。所以新的科学原理的提出,常常会对社会产生深刻而广泛的影响。正因为科学原理的意义如此之大,所以“科学”也常常被盗用。许多技术性的产出,也被带上了“科学”这个帽子。在计算机领域,图灵机与计算复杂性理论基本上属于科学原理这个范畴。也正因为如此,计算机才被冠以了“科学”的称谓。

从根本上看,人工智能热潮在90年代的冷却,是因为人们在人工智能领域经过了几十年的努力,没有能够理解一般意义上的智能过程的本质,因而也就没有能够取得科学意义上的原理性突破,在理论上抽象出类似数字基本计算那样的基本智能操作,用以支撑更为高级复杂的智能过程。所以人工智能领域的产出,虽然丰富而且影响巨大,但是却始终没有达到科学原理的高度。

在一个产业中,会有一些基础性共性技术,有时也被称为核心技术,它们支撑着整个产业。在信息技术产业中,操作系统、数据库、集成电路等就属于这个层面的技术。这些技术的进步,对整个产业的影响也是全局性的。正是集成电路技术的进步,促成了2010年前后整个信息技术产业发生了历史性的转折(见《转折——眺望IT巅峰》第二章第三节)。人工智能领域不仅没有科学原理层面的成果,而且至今也没有能够产生支撑一个产业的基础共性技术,不论我们给那些技术/方法起个什么样的名字。

在基础共性技术之上,还有面向不同问题的具体应用技术去解决不同类型的问题。在这个层面,我们才遇到了人工智能的踪影。如我们在《转折——眺望IT峰》一书第八章第二节中所述:“当人们意识到我们没有能力用一些普适的基本逻辑化规则或机制去有效地解决各种‘智能问题’时,人工智能的研究便扎入到了各种具体的问题之中。针对不同类型的问题,发展出了花样繁多的解决方法,也取得了很大的进展。…….也正因为如此,人工智能目前更多地是被当成了一些具体的应用工具方法,融入到了不同类型的应用之中,以自己具体的技术性名称出现,默默无闻地发挥着自己的作用。这些年关于人工智能的一本经典的教科书的名字是‘人工智能——一种现代方法’,……它的副标题‘A Modern Approach’就是指试图采用‘智能体’(Agent)的概念将人工智能在各个不同领域中的方法整合到一个统一的框架之中。”

其实,用智能体这个概念整合与人工智能相关的技术方法,也是没有办法的办法,显示出了这个领域的一种无奈的现实:只有实用的一些具体技术方法,缺少科学原理或基础共性技术的支撑,也没有基础性系统级的有效理论。这些年被热捧的“深度学习”,也是这个层面的技术。

“深度学习”这个概念包括了深度信念网络、卷积神经网络、循环与递归网络等多种不同的具体网络模型与相应的算法,用来解决不同类型的问题。它们实际上是借助计算机的“暴力”计算能力,用大规模的、含有高达千万以上的可调参数的非线性人工神经网络,使用特定的“学习/训练”算法,通过对大量样本的统计处理,调整这些参数,实现非线性拟合(变换),从而实现对输入数据特征的提取与后续的分类等功能。

它是解决特定类型问题的一些具体的方法,而不是具有像人那样的一般意义上的学习的能力,尽管这个名字确实引发了许多不了解这个技术的人的这方面的想象。其实,信息技术领域内的绝大部分技术,基本都属于这个层面,包括与大数据相关的技术,而且它们也都属于辅助智能性质的技术。所以,大数据、人工智能与其它的技术彼此的界限日益模糊。

这些具体的实用性技术,包括“深度学习”(人工神经网络),常常是实验性技术,在应用于一个新的具体问题之前,我们无法确定它是否能够有效地解决这个问题,或者能够将问题解决到什么程度。

正因为如此,以深度学习为例,在《深度学习》(【美】伊恩·古德费洛等著,MIT Press出版,2016年)这本被认为是“深度学习”领域奠基性的经典教材中,作者为了阐述深度学习的这种实验性特征,专门设置第11章来讨论这个问题,它的题目取为“实践方法论”。

在这一章的开头,作者写了这样一段话:“要成功地使用深度学习技术,仅仅知道存在哪些算法和解释它们为何有效的原理是不够的。一个优秀的机器学习实践者还需要知道如何针对具体应用挑选一个合适的算法以及如何监控,并根据实验反馈改进机器学习系统。在机器学习系统的日常开发中,实践者需要决定是否收集更多的数据、增加或减少模型容量、添加或删除正则化项、改进模型的优化、改进模型的近似推断或调整模型的软件实现。尝试这些操作都需要大量时间,因此确定正确的做法而不盲目猜测尤为重要。”这段话比较完整地揭示了深度学习这个具体技术的实验性特征。

人工智能的这种状态多少有点像传统领域在现代科学出现以前,人们通过经验摸索,也能够设计制造出很多不同类型的精巧工具来解决各种具体的问题的状况。而具体的实用技术再丰富精妙,也未必能够产生出更深一层的原理性、普适性的成果。中国历史上无数的能工巧匠都没有能够让中国赶上现代科技发展的潮流,就说明了这个问题。

以上各层的产出,都还不能直接服务于人。所以在它们之上,还有把技术变成实用产品/系统的原理与技术。在此为了简便我们只分了两层。特别需要指出的是,由于人工智能等技术属于具体应用技术,而不是系统级技术,所以事实上它们自己无法成为构造实际应用系统/产品的基础,而必须依附于系统级原理与相关技术才能发挥作用。虽然当初有过主要基于人工智能技术构造系统的努力,比如日本的第五代计算机,今后这种努力也不会完全消失。但是,从人工智能技术的客观本质来看,将其作为具体层面的应用技术来使用,才是合理的选择。

对底层技术发挥自身价值起决定性作用的,是基础系统原理及相关的技术。比如冯诺依曼架构就属于这个范畴。它之所以成为了计算机领域的核心成就,就是因为这个架构使得我们能够利用相关的具体技术设计制造出实际可以使用的计算机系统产品,借助计算机系统产品让相关的具体技术在各个领域里发挥出自己应有的价值。

这一层的基础系统原理及相关的技术与具体的应用领域相对独立,所以其影响也是全局性的。它们不仅包括了独立基础性系统的原理与相关系技术,还包括了大量独立系统之间的交互链接组成更宏观的基础性大系统的原理与相关技术。互联网、云计算就属于这个类别。在网络化的信息技术领域,组成宏观大系统的原理与技术在起到日益重要的作用。当然独立基础性系统的创新,是大规模互联系统的前提,其作用更为基础。

这一层基础系统原理与相关技术层面的创新的重要性,远远超过了那些具体应用技术,至少可以与基础共性技术比肩,有些甚至接近科学原理。所以冯诺依曼架构在计算机领域才有了如此崇高的地位。而人脑的强大功能,不仅仅体现在具体的智力能力上,还体现在它的系统层面。这种系统层面的优势,在本章第一节中我们用实例指出,它不仅仅是在于大量神经元之间的分布式联接而形成的高度分布的网络,在下一节我们还会从另外一个方面分析人脑在系统层面的一个重要的、没有被充分重视的特征。

同属于这个层面的除了互联网,云计算以外还有最近备受关注的“区块链”。2009年伴随比特币出现的区块链技术,最能说明系统层面的突破,如何能够让下层具体的应用技术发挥出最大的价值了。

2008年11月,一个自称为“中本聪”的匿名人士在互联网上发表了一篇简短但影响重大的文章:“Bitcoin: A Peer-to-Peer Electronic Cash System”(比特币:一个对等网络上的现金系统)。2009年1月3日,中本聪自己在比特币系统里建立了第一个区块(创世块),由区块链支撑的比特币系统开始运转,区块链技术正式登场。该技术的示意见图2。

图2 区块链示意

仔细研究区块链中的具体技术我们就会发现,区块链所使用的解决具体问题的技术,如非对称加密,防篡改,对等网络等等,都是现有的技术,没有任何一个是中本聪发明或改进过的。仅仅使用这些现成的技术,中本聪却创造出了一个在开放互联网上分布式运行、不用监管、人人可以参与记账、账目公开透明,同时又是可信、可靠、安全、精准无误的现金系统。

如果说虽然至今还没有基本的可行性,但是无数人依然在向往创造出与人有着同样智能,甚至超越人的智能化系统的话,一个这样的现金系统在被创造出来之前,可以说基本任何人都没有想到过要去实现这个目标,也不会相信有人能够把它创造出来。这是一个建立在现有信息具体技术之上、超出了所有人想象的信息技术奇迹。

这个奇迹依靠的不是解决具体问题的技术的新突破,而是一个创新的系统性原理与设计。中本聪充分利用了分布式开放网络环境下人的行为特征,巧妙地创造出了可以运行在开放的互联网上的基于区块链的分布式系统。比特币中保证账务记录准确无误的所谓“共识算法”,正是这个分布式系统的系统级运行机制的一部分。或者说共识算法是通过分布式系统的系统级运行机制的设计而实现的。区块链技术之所以难以被准确把握与理解,就在于它的许多本质的特性是由系统级机制决定的,而不是依靠单点技术来实现。

不论区块链的技术未来会有什么样的应用,它的出现本身都给我们带来了非常深刻的启示。

首先,它让我们在信息技术产业中看到了一个活生生的、利用成熟的具体技术做系统级创新所能够创造出来的、超出所有人想象、超出了具体技术所能够达到的、奇迹般的颠覆性效果。系统的重要性,在上个世纪八十年代就被高度重视了。当时在科技界有着著名的三论之说,即信息论,控制论与系统论。对系统论的高度重视,是对近代科技发展历程认识深化的结果。钱学森做出的最重要的一个历史性贡献,就是把系统论的观点与方法深深地植入了中国的许多领域,特别是航天领域。

在传统的产业中我们也能看到大量的系统性创新对具体技术的超越。我们简单看一下航空工业的例子。早期的飞机所采用的动力是活塞发动机。后来在上个世纪三十年代末,德国率先将喷气式飞机送上了天。随后涡轮喷气发动机成为了航空动力的主角。这两种发动机在科学原理上是相同的,都是利用燃料燃烧导致气体膨胀而将热能转化为机械能。但是两者的系统级原理却完全不同。涡轮喷气发动机是航空动力系统的一次基础性系统级颠覆式创新。它所带来的进步,不是活塞发动机在任何具体层面的技术或材料的改进所能够比拟的。它给航空产业带来了天翻地覆的变化。

图3 活塞发动机与涡轮喷气发动机

在今天的军事领域,决定战场优势的也不再仅仅是具体兵器在传统意义上的先进性,而是海陆空天一体化的超级系统。这是当代战争一个质的飞跃。

其次,面对区块链带来的令人瞠目的结果,我们不仅要发问:在信息技术产业开启了其黄金时代的大门之后,是否有会有更多的、超出我们想象的、基于系统级的创新不断出现,从而对人类社会的各个领域产生颠覆式的影响?

相比于区块链创造的奇迹,我们把自己的想象集中于工具智能的提高上,虽然很有道理,但视野可能过于偏狭了。目前区块链的奇迹与比较复杂的智能技术没有太多的直接联系,更不是对人的智能活动的重复或模仿,但却有惊人的颠覆性冲击。当然,如果区块链在未来得到广泛应用,各种具体的智能技术融入其中也是必然的趋势。

在当今信息技术产业的热点中,与大数据和人工智能相比,由于它的专业性区块链是一个相对寂寞的技术。但正是它,给我们打开了一扇独特的观察信息技术产业未来发展的窗户,提供了一个独特的视角,它所揭示的潜在可能,对我们有效地把握信息技术产业乃至整个人类文明的未来发展或许具有更本质而重要的意义。

当前信息技术应用系统越来越多地成为了软件的设计,而正如我们在《转折—眺望IT巅峰》第二章第一节中指出的那样,“与实物产品的设计开发相比,软件开发几乎是在一个无限资源的虚拟空间里的随意发挥。以至于软件设计开发甚至被认为是一种纯精神化的艺术创作过程。”正是这种随意创作的自由,才出现了区块链的奇迹,也将催生更多的、超出我们今天最浪漫的想象边界的、各种不同系统规模的颠覆性系统级创新。

许多系统将要实现的功能在整体上将远远超出今天我们对人工智能的期待,它们不会拥有人这样的主体地位,但是在功效上却会极大地超越人在智能上作为一个个体所能达到的高度与广度——就像辅助体能的机械性工具在体能的各个方面实现的对人的全面超越。而这些系统所具有的“智能”在性质上将会与人的智能有重大区别,正如区块链系统展示给我们的那样。这些系统正在被逐步创造出来,并将形成一个空前复杂的虚拟世界。

在充分重视人工智能等具体应用技术的进展与带来的冲击的同时,我们应该展开我们的想象,更加重视基础系统级原理及相关技术的创新。信息技术产业发展的未来,可能更多地由这个层面的颠覆式创新所决定。而人工智能等具体的技术,将在这些创新中,找到更好的、更大的发挥舞台。

《转折——眺望IT巅峰》一书中详细介绍的以主体虚拟映像为核心的智能系统是信息技术产业中基础系统原理与技术层面的、具有系统性智能意义的一个重要的创新,代表了信息类应用未来的一个极为重要的方向,是人类在智能追求上的一个巨大进步,也是人类辅助智能类工具的一个质的飞跃。

作者简介:谢耘博士,首都科技领军人才,清华大学电子工程系博士。著有《我的职场十年》、《成长——从校园到职场》、《转折——眺望IT巅峰 》。

责任编辑:陈轩甫
人工智能 大数据
观察者APP,更好阅读体验

以色列“有限复仇”:选在了伊朗核计划中心

以色列“报复”开始:伊朗多地传出爆炸声

5.3%,一季度“开门红”能转化为“全年红”吗?

“以色列精心策划俩月,但严重低估了伊朗反应”

美国胁迫下,阿斯麦CEO最新涉华表态