陈经:根据AlphaGo弈城围棋网的疑似测试对局预测谷李大战比分

来源:观察者网

2016-03-05 08:35

陈经

陈经作者

风云学会会员,《中国的官办经济》

弈城围棋网有一个账号叫deepmind。2016年1月28号谷歌Deepmind小组开发的围棋程序AlphaGo战胜职业选手的劲爆消息出来之后,这个账号名引发了棋迷的关注。之后AlphaGo的共同第一作者Aja Huang发贴说,这个账号是他本人的,但否认是AlphaGo。对此我们根据deepmind的历史战绩进行一些推测。

2014年4月2日,deepmind在弈城下了第一盘棋,一开始注册是5D。半个月时间,这个账号分别以17胜1负和15胜3负的成绩,升上了6D和7D。弈城围棋网5D及以上的升段规则是和同级别对手下“升降级对局”,最后20局里胜15局升1段,全胜升2段。然后deepmind就在7D与8D之间上上下下,从2014年4月17日到2015年9月16日长达1年半的时间,一共五次从7D升到8D,四次从8D降到7D,下了300多盘。这个战绩是标准的强7弱8,也符合Aja Huang台湾业余六段的水平。这一切都很正常。

之后发生了奇妙的事情。2015年8月23日,deepmind第五次打上了8D,升段当天连下了6盘,还全输了。之后到8月29号7连胜,9月4号5号又四连败。然后到9月16号,8胜1负,累计战绩15胜5负,首次升上了9D!打上9D以后当天下了一盘,输了。然后接近三个月没下棋。一个强7弱8,偶而运气爆棚冲上9D也是可能的,正常的轨迹应该是迅速掉下8。

接下来在2015年10月,谷歌和樊麾二段签了保密协议,让AlphaG和他下了5盘正式对局5:0,2016年1月28发布消息时棋谱也公布了。还有5盘非正式对局,樊麾赢了2盘,棋谱未公布。

2015年12月2号,deepmind重新开始在9D上下棋,一直到2016年2月28日,一共下了136盘。一开始就在9D上打了一波13胜2负,表现得象一个强9。然后12月底到2016年1月,一波8连败掉到8D了,这个战绩到是很象强7弱8。然后迅速地15胜5负,2016年2月2日回到9D。升上9D又是一波15胜2负。之后时胜时负,一直在9D。

2月27号开始,deepmind更多地和职业棋手对局了。弈城账号标注为P的是经过验证的职业棋手,deepmind胜了mob(P),输给了另三位。对手中也有虽然未标注为P,但和职业棋手账号互有胜负的强9,如amalauag,从历史战绩看也是有职业棋手实力的。deepmind和amalauag下了三盘,2胜1负。

如果是Aja Huang本人下,很不可能对9d取得经常性的连胜,更不可能和职业棋手们互有胜负,差距应该在三子左右。合理推测,谷歌围棋到弈城网上测试也属正常。2月23号谷歌与李世石人机大战发布会公布的信息,3月8号到15号代表AlphaGo与李世石在棋盘上进行五盘对局的,正是Aja Huang。他负责摆放棋子,并输入招数到机器。这也可以说是Aja Huang在下棋,他发贴说deepmind是自己在弈城上下也可以解释。谷李大战在即,谷歌加紧测试,在弈城上更多找职业棋手过招。

如果说以上是基于战绩的推测,可以进一步看下棋谱的印记。

AlphaGo执黑对樊麾

这是AlphaGo与樊麾的第二盘对局,开局就是一个大雪崩定式。第31手,AlphaGo下了这招明显异常的“点”,与白32挡交换。几个职业棋手都指出,这个点和白挡的交换,有明显的潜在损失。本来不点,黑挡在G2位是个先手,白要应的。现在有了白32立的硬腿,黑再要挡在G2位,就不是先手了,因为接下来黑收气,白可以A2吃掉黑。

AlphaGo执黑对樊麾

如果一定要下点这招,那么点了以后,黑也应该立刻A6爬回,与白A2交换。接下来黑A7接是先手,能保证黑是绝对两眼活棋,还不损空。然而AlphaGo没有走,如上图让樊麾38抢先扳到与AlphaGo的39接交换,空损了。接下来如果白B11点,黑这块将只有一个眼。31的点以及后续让白抢到38扳,AlphaGo的损失虽然不大,但确实是明显的问题手。

2014年7月30日,阿含桐山杯8强赛柯洁执黑对古力

职业棋手和业余高手肯定不会这样下的。如上图,古力对柯洁也下了同样的大雪崩。古力第40手也点了,但点的时机是,白右边S13的挡已经不可能下到了,不需要保留了。而且后来古力44手抢先爬回定型,保证两眼。柯洁43手不能扳N19吃三子太小,古力44就爬了。

弈城围棋网2015年12月6日,deepmind执白对Reminisce

上图是deepmind和Reminisce的对局,也是大雪崩。第50手,deepmind和AlphaGo一样下了这个点,也同样没有T6爬回,被对手55手抢先扳到。当然和AlphaGo那局一样,亏的不多,对手也和樊麾一样后面杀崩了迅速败阵。

看到deepmind这个账号在弈城围棋网上离奇的战绩轨迹,以及棋谱上与AlphaGo的不谋而合,对网络围棋比较熟的棋友们大概心里有数了吧。

显然,这也是近来和deepmind对局的弈城9D及带P的职业棋手们的感觉。他们和deepmind对局时似乎明白网络另一头是谁,纷纷出招测试,下了不少精彩的棋。

除去deepmind在9d上明显是Aja Huang本人在下的连败对局,大致可以评估一下它的实力。有兴趣的可以到弈城围棋下载客户端、注册账号,自己查找deepmind的所有棋谱观看。

对于一般的9d,deepmind,或者说背后的AlphaGo有明显优势,可以轻松地连胜。棋谱上表现出来就是大局观好,空很容易就领先了,或者一个局部下来就占了压倒性优势了。但也不是特别稳定,偶而会输(也有可能是Aja Huang本人在下)。

deepmind对带P的职业棋手,还占不到什么便宜,虽然也有胜局,但是负多胜少。这些出战的职业棋手并非职业强手,大致要排名100名以后了,和李世石差距不小。但他们比樊麾的实力要强一些,对李世石也不是没有胜机,不是让先的水平差距。

之前李世石2月16日就人机大战接受采访时就说,除了与樊麾的对局,他还到网上找了三四盘AlphaGo的棋谱来研究,认为是自己让先到二子的实力,有绝对必胜的信心。很可能他找的就是deepmind在弈城网的棋谱。之后deepmind在弈城上又和更强的对手下了多盘,感觉实力有所提升,李世石让先不一定行。

大致可以判断,AlphaGo在弈城上进行测试,表现出来的是职业棋手中较弱的水平,但显然是有职业水平的。而且可能它是用单机版进行测试,人机对战时显然会用多得多的服务器。但也不会带来很大的水平提升,根据谷歌发表在《自然》上的文章,服务器版对单机版也只有77%的胜率,大约3:1的战绩。

人机大战将在2016年3月8日开战,也没几天了。如果弈城上deepmind账号这几天的棋谱能体现AlphaGo的实力,那么和李世石还是有着明显的实力差距。但这种差距不是业余棋手与职业棋手之间那种绝对水平的差距,已经可以谈胜负概率了。

李世石必须小心应对,甚至不能有“上手心态”,必须把对手当作一个职业棋手来认真对待。特别的是,职业棋手对局,低手就算暂时领先,高手仍会有大把机会。因为低手面对“胜机”会出现心理波动,高手会选复杂的下,低手心理紧张再加时间不够,犯错送回来很常见。但AlphaGo的表现会非常稳定,算得也很快,李世石出了致命错误以后,想靠搅局翻盘不会成功。

李世石29日接受韩国电视台采访

李世石说,作为人类代表,要取得五盘全胜,因为输一盘就会给出电脑将要取胜的危险信号。他想一盘不输,必须从一开始就非常小心,抓住AlphaGo的一些不严谨的小错,建立并扩大领先优势。五盘对局,每盘双方手数以250手计,李世石要下600-700手,出现致命错误的概率还是有的。

如果要预测比赛胜负,李世石肯定会获胜,得到100万美元奖金。五番棋高手的胜率远高于单局胜率。柯洁对李世石如果有4:1的胜率(目前为7:2),他声称的“梦百合杯五番决赛李的胜机不足5%”在数学概率上就是一个合理估计。这次柯洁估计AlphaGo对李世石的胜机还不到5%,直觉上也是成立的。

但是这比赛不管胜负要下满五盘,李世石想五盘全胜也不容易。预计谷李大战,最后比分为4:1。李世石胜出维护人类尊严,但AlphaGo取得的进展也继续令人惊叹。

作者简介:笔名陈经,香港科技大学计算机科学硕士,中国科学技术大学风云学会研究员,棋力新浪围棋6D。21世纪初开始有独特原创性的经济研究,2003年的《经济版图中的发展中国家》预言中国将不断产业升级,挑战发达国家,2006年著有《中国的“官办经济”》。

本文系观察者网独家稿件,文章内容纯属作者个人观点,不代表平台观点,未经授权,不得转载,否则将追究法律责任。关注观察者网微信guanchacn,每日阅读趣味文章。

责任编辑:陈轩甫
围棋 人工智能 谷歌 李世石
观察者APP,更好阅读体验

最后通牒?以色列放话“要么签,要么打”

“这把火怎么点着的?”

布林肯来华谈的怎么样?是否不虚此行?

“看看,这就是美国的警察”

习近平会见布林肯:中美应彼此成就,而不是互相伤害