万维读者网 > 信息时代 > 正文  

谷歌的AlphaGo 是怎样模拟人类“思考”的

www.creaders.net | 2016-01-31 09:10:32  观察者网 | 0条评论 | 查看/发表评论

  1月28日,谷歌的人工智能系统AlphaGo以5比0击败了职业棋手樊麾引发了围棋圈和人工智能圈的震荡。这是在1997年IBM的国际象棋程序“深蓝”战胜了国际象棋冠军卡斯帕罗夫后,人工智能在围棋领域第一次在未让子的情况下击败职业选手。那么AlphaGo的棋力究竟几何,到底是怎样模拟人类“思考”的呢?

  AlphaGo棋力如何

  在围棋人工智能程序方面,除了开源程序Pachi和Fuego,还有日本的Zen、韩国的DolBaram和法国的CrazyStone。按照以往的战绩来看,AlphaGo和Crazy Stone、Zen的战绩为495战,494胜,而且在让四子的情况下(让对方先下四个子),与Crazy Stone、Zen的胜利为77%和86%。虽然还没有AlphaGo与韩国DolBaram交手的具体战绩,但这并不妨碍AlphaGo成为现阶段顶尖水平围棋人工智能程序。

  职业棋手的段位是根据比赛成绩来确定的——根据胜、负、和的成绩计算积分,按照积分高低将棋手分为初段—九段,而且段位会根据棋手在一定时间内的比赛成绩而上升或下降。根据2014年12月31日公布的中国围棋职业棋手等级分排名,在让4子和5子的情况下战胜DolBaram的中国棋手连笑(七段)排名为第12位,而作为棋坛宿将的李世石(九段)的棋力则更胜一筹。

  被AlphaGo击败的中国职业二段棋手樊麾,在棋力上与即将和AlphaGo交手的李世石,以及战胜DolBaram的连笑有着非常大的差距,但毕竟具备职业棋手的基本素质和水平。就现今的战绩来看,AlphaGo基本具备不低于职业初段棋手的棋力。

  如果AlphaGo的棋力与韩国DolBaram的水平相当,或仅仅是略优于DolBaram,那显然是无法战胜李世石的。若是AlphaGo具备能在让6子的情况下战胜DolBaram的棋力,那么和李世石的比赛就有可能存在一定悬念了。笔者在此斗胆做一个推测,即便在和樊麾对决后的5个月后(和樊麾对决在2015年10月),AlphaGo的棋力又有所增长,但技术的进步有一个过程,就如国际象棋程序在80年代末就有战胜国际象棋大师的战绩,但真正打败卡斯帕罗夫要到1997年。也许在将来AlphaGo能与李世石一较高下,但就现阶段而言,AlphaGo战胜李世石的可能性并不高。

  就现阶段而言,AlphaGo战胜李世石的可能性并不高。

  职业选手如何评价AlphaGo

  为了更直观地说明AlphaGo的棋力,笔者将职业棋手看完对局后的评价列举如下,感谢知乎网友@专吃刘小羊 的汇总整理。

  时越九段(世界冠军,中国棋院等级分第二位):

  说实话,我昨天看到这个消息的时候是不信的,虽然我现在还是不能理解电脑是怎么去学习的,但是事实摆在眼前,这5盘棋电脑下的让我惊叹,我认为水平已经迈入了职业的门槛。虽然和顶尖棋手还差的很远,但按照这个进步速度,3月份的对局,我想李世石也不会赢的太轻松。

  樊麾二段(法国国家队总教练,AlphaGo的对手):

  第一盘输了之后,我这个心态就发生了很大变化,因为第一盘毕竟觉得可能比较轻松,然后发现他的官子、各方面的掌控能力很强之后,我第二盘就有点(心态)失衡。第二盘打了一个大勺之后,整个进程就不对了。围棋毕竟不能用单纯的技术来说,一是一、二是二、三是三,因为毕竟有发挥的问题。不过我确实下的也不是很好,当然了,下的时候心态也是一个最主要的原因。不管怎么样,AlphaGo的棋力确实已经很强了。这几盘棋呢,可以说我自己发挥不佳,但不能说不是我的真实水平,下得不好。主要是在某些方面觉得被他彻底克制住了,尤其心理负担很重,总感觉下到最后一读秒就会打勺子,这就导致我的棋下的很急。

  柯洁九段(世界冠军,中国棋院等级分第一位,当前的世界第一人):

  果壳网:假如是不知情地去看AlphaGo和樊麾的这五盘棋,你会猜到AlphaGo不是人类吗?

  柯洁:完全看不出来。这五盘棋我也仔细地看了一眼,但我没看名字,不知道谁执黑谁执白,完全看不出谁是AI。感觉就像是一个真正的人类下的棋一样。该弃的地方也会弃,该退出的地方也会退出,非常均衡的一个棋风,真是看不出来出自程序之手。因为之前的ZEN那样的程序,经常会莫名其妙的抽风,突然跑到一个无关紧要的地方下棋。它这个不会。它知道哪个地方重要,会在重要的地方下棋,不会突然短路。这一点是非常厉害的。

  果壳网:就电脑的表现来看,你对它布局、中盘、官子三个阶段的评价,分别是什么水平?

  柯洁:按照我的评价,它的水平大概就是冲职业段之前的水平,虽然职业还到不了,但是无限接近于职业了。关于这几个阶段,我的感觉是都差不多,非常均衡,也看不出哪个地方是机器,这个很恐怖(笑)。当然这只是看了五盘棋,也看不出它的短板来,可能是因为对手发挥得太糟糕了(笑),我也看不出来具体的哪里好哪里不好。

  芈昱廷九段(世界冠军,中国棋院等级分第四位):

  问:今早的大新闻是谷歌围棋AlphaGo5比0赢了樊麾二段,是否已看过棋谱?

  芈昱廷:知道后感觉很刺激,看棋谱觉得实力相当于冲段少年。

  李喆七段(全国冠军):

  Google的围棋AI已经具有职业水准,从棋谱初步判断是顶尖棋手让先-让先倒贴目的水平,离战胜人类还有一小段距离。但这是三个月前的棋谱……以Google机器学习堆数据的速速,今年三月对决李世石相当值得期待。

  刘星七段(全国冠军):

  第一是棋形很正,第二是失误相当的少。如果把它看作一名业余顶尖的棋手,做到这两点,就已经具备了相当的实力。(赵守洵:星爷还没有把它看作职业高手) (刘星:这个很难说)

  AlphaGo获胜的秘诀何在

  在国际象棋上,因为王、后、车、相、马、兵的重要性不一样,程序员可以对不同的子设定不同的分值,比如王10分,后8分……让计算机以判定分值的高低来指导计算机计算和落子。但围棋的棋子没有大小之分,使得计算机很难做出取舍,只能以穷举法的方式进行计算。而围棋的另一个特点是非常复杂——下棋时可能会遭遇3^361 种变化,在过去计算机性能相对有限的情况下,又没有一个良好的算法进行辅助,使用穷举法计算自然导致人工智能虽然在国际象棋上战胜了卡斯帕罗夫,但在围棋领域一直处于业余棋手的棋力水平。

  AlphaGo战胜樊麾的秘诀在于神经网络系统、蒙特卡洛算法和深度学习。

  神经网络系统是以人类大脑为原型的信息处理模式,可以根据特定的输入产生特定输出,并实现图片识别、语音识别等功能。谷歌做了两个神经网络,一个神经网络用于动态评估——计算对手下一步棋落子的各自可能性,依靠计算机远远超过棋手的计算能力,在某种程度上会占据一定优势。另一个神经网络用于静态评估——评估棋局交战双方总体态势。

  此外,谷歌还输入了海量棋手对弈的棋谱,并让AlphaGo以棋谱的数据为基础进行了几千万局自我对局,充分丰富了数据库,并将预测对手下一步棋落子的准确率提升到57%。

  在下棋的过程中,辅以蒙特卡洛算法——因为围棋的各个棋子很难用数值进行打分量化,也不存在精确描述棋局的“围棋定律”,使得计算机在静态评估方面,单纯的高计算能力未必会强于职业棋手“棋感”之类的抽象思维。通用性的围棋盘面静态评估函数曾经是围棋人工智能的瓶颈,在引入蒙特卡洛算法后则很大程度上解决了这个问题。蒙特卡洛算法构造了一个随机的过程,并对过程采用进行统计评估,从而得出一个最优的解法。

  局面静态评估好比人类棋手的“第一感”。由于缺少“靠谱”的静态评估方法,目前所有顶级围棋程序转而采取一种比较“谨慎”的信息汇总策略。

  简单地说,蒙特卡罗算法对计算进行了筛选,对数据库中低胜率的选择直接抛弃,放弃了穷举法中那些大量消耗计算资源,但却没有意义的计算。明确了计算的主攻方向,使其对具有高胜率的选择有更加精确的计算和分析。特别是在选择策略中加入更多和围棋相关的专业知识,使得基于蒙特卡洛树搜索的围棋弈棋系统水平拥有和职业棋手较量的能力。

  图为使用蒙特卡罗方法估算π值。相同的“蒙特卡洛”思想也可以用于围棋盘面评估。每个围棋盘面都有一个“最优值”,对应于对弈双方都采用完美走法的情况下该盘面的最终结果。根据蒙特卡洛思想对整个可能性空间进行某种采样,然后通过统计估值的方法逼近这个最优值。

  AlphaGo只会复制人类棋手的招数?

  有一种观点认为,只要下AlphaGo棋谱中所未记载的招数就能获胜,哪怕这些下法根本不符合围棋棋理。但笔者认为,这种做法的可行性并不高。

  AlphaGo并非是对人类棋手弈棋棋谱记忆后的简单再现,而是具备了一定模拟人类神经网络的“思考”能力,既不是像过去那样采用穷举法寻找最优选项,也不是复制棋谱中所记载的定势或手筋。而是会对选择进行“思考”,删除那些胜率低的选择,并对具有高胜率的选项进行深度“思考”,最终从无数个落子的选择中基于自己的“思考”选择一个最优项。

  因此,若是人类棋手想凭借下几步不符合围棋棋理,或未被棋谱记载的围棋下法,就轻而易举战胜AlphaGo,可能性并不高。因为AlphaGo是人工智能,而不是一台只会复制人类棋手招数的机器。

  AlphaGo依靠精确的专家评估系统(value network)、基于海量数据的深度神经网络(policy network),及传统的人工智能方法蒙特卡洛树搜索的组合,已经至少达到了与标准业余6段棋手,或中国职业棋手等级分200位之后的棋手实力相当的地步,如果有人类顶尖棋手长期陪伴AlphaGo对弈,AlphaGo的棋力还会进一步提高。

  因此,AlphaGo已经不再是可以依靠程序漏洞就可以战胜的围棋程序,正如连笑在让6子的情况下负于DolBaram的那场棋赛,在比赛中连笑被吃掉一条大龙。对此,连笑表示,“我知道那块棋要死,但是以为它看不出来,没想到它很快就下出来了,后面打劫的地方他也下得很好。”

  展望人工智能

  目前,限制人工智能发展的核心因素有两个:一是算法上还没有达到完善,人类对智能计算的过程理解不够,目前的算法依旧有很大的改进提升空间。二是计算机硬件瓶颈。虽然计算机技术在过去30年中突飞猛进,但目前的集成电路相对于人类大脑有千亿神经元,数百万亿突触构成的复杂网络,还是有着多个数量级差距。

  但人工智能并非遥不可及,在很多方面已经有了非常广泛的应用,比如已经商用化,或已经走入寻常百姓家的语音识别、图像识别、自动翻译、广告推荐、数据挖掘等。

  除了上述提到的理解外部输入感知智能。更高级的智能如推理想象、决策涌现等被称为认知智能。谷歌围棋可能是认知智能方面的突破,相关的技术突破不仅仅限于围棋人工智能一隅,还可能会带来一系列的这方面的新技术和产品。使人工智能在影响着社会生产的同时,充分服务于人们的生活。

   0


24小时新闻排行榜 更多>>
1 大势已去 普京准备玩命
2 当街开枪!习当局要大开杀戒
3 中国高铁 正在沦为巨大的陷阱
4 “大战”开打!中国突然闪击波兰
5 “胡”姓爸给儿取名 老师再也不点他名了
热门专题
1
美国大选
6
巴黎奥运
11
中国爆雷
2
中美冷战
7
三中全会
12
李尚福出事
3
乌克兰战争
8
中共两会
13
秦刚失踪
4
以哈战争
9
台湾大选
14
火箭军悬案
5
万维专栏
10
李克强
15
台海风云
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.