最强“新狗”AlphaGo Zero发布 柯洁:对于它的自我进步来讲,人类太多余

来源:观察者网综合

2017-10-19 15:27

北京时间今天(10月19日)凌晨,谷歌旗下的DeepMind团队公布了进化后的最强版AlphaGo ,代号AlphaGo Zero。AlphaGo曾打败了中国顶尖棋手柯洁,而AlphaGo Zero经过3天的训练,就以100:0的比分完胜AlphaGo。这条消息点燃了中国围棋界,连柯洁也发微博感叹:对于AlphaGo的自我进步来讲,人类太多余了……

谷歌今天发布的这款名为AlphaGo Zero有多厉害?据“快科技”网站文章的介绍,它的系统可以通过自我对弈进行学习,它利用了一种名为强化学习的技术。在不断训练的过程中,这套系统开始靠自己的能力学会围棋中的一些高级概念。

经过3天的训练后,这套系统已经可以击败AlphaGo Lee,也就是去年击败韩国顶尖棋手李世石的那套系统,而且比分高达100比0。经过40天训练后,它总计运行了大约2900万次自我对弈,使得AlphaGo Zero得以击败AlphaGo Master(今年早些时候击败世界冠军柯洁的系统),比分为89比11。

AlphaGo之父戴密斯·哈萨比斯(Demis Hassabis)

与学习大量人类棋谱起步的前代AlphaGo不同,AlphaGo Zero是从“婴儿般的白纸”开始,通过3天数百万盘自我对弈,走完了人类千年的围棋历史,并探索出了不少横空出世的招法。

值得注意的是,虽然AlphaGo Zero在几周的训练期间学会了一些关键概念,但该系统学习的方法与人类有所不同。另外,AlphaGo Zero也比前几代系统更加节能,AlphaGo Lee需要使用几台机器和48个谷歌TPU机器学习加速芯片。其上一代AlphaGo Fan则要用到176个GPU芯片。AlphaGo Zero只需要使用一台配有4个TPU的机器即可。

DeepMind团队创始人David Silver介绍AlphaGo Zero说,这款程序超越了过去所有的AlphaGo版本,目前是世界上最大强大的围棋程序。

视频截图,下同

它的学习不使用人类数据,而是自我学习,完全从零开始。之所以它能比向人类数据学习的程序效果更好,是因为它每次对弈的“陪练”都被校准为与它持平的水平,它的“陪练”从非常基础的水平开始,逐渐上升为非常高的水平。

David Silver还说,人们一般认为机器学习就是大数据和海量计算,但是他们在AlphaGo Zero的研究中发现,算法比所谓计算或数据可用性更重要。

以下是完整视频:

DeepMind联合创始人和总裁David Silver介绍新版阿法狗。 (视频自腾讯)

这篇论文发出的消息迅速点燃了围棋界。曾和“阿法狗”交过手的中国棋手柯洁在微博感叹:“一个纯净、纯粹自我学习的alphago是最强的……对于alphago的自我进步来讲……人类太多余了……”

(截图自微博)

今年五月,输给阿法狗的的柯洁曾在赛后一度哽咽,称:“它太完美,我很痛苦,看不到任何胜利的希望。”在赛后的发布会上,柯洁说,“很感谢AlphaGo,我居然能有这么大差距,希望我能再努力,让差距更小一点。AlphaGo实在太完美,以后差距只能越来越大,我只能说对自己的表现感觉很遗憾,为DeepMind团队感到开心,AlphaGo棋手能表现这么完美,真是了不起。”

今年五月,柯洁对阵“阿法狗”。 (视频截图)

棋手古力也转发了这条微博,说:“20年不抵3天啊!我们的伤感,人类的进步!”

“AlphaGo Zero”的发布再起引起网友对人工智能的热烈讨论,人工智能对人类的超越让人既惊喜又担忧。 在网友看来,机器虽然在比赛上胜过了人类,却无法取代赢得人类的情感,尤其对于广大围棋迷来说,“阿法狗”并不能替代他们心中的棋手。

责任编辑:魏其濛
人工智能 谷歌 围棋
观察者APP,更好阅读体验

美方对俄隐瞒了部分信息?克宫回应

这条中马“一带一路”重点铁路项目 “或延伸至泰国”

国防部表态:中方不会在南海问题上任菲胡来

关于ASML出口管制,荷兰首相在华表态

警惕!“隐秘”的调查暗藏国家安全风险