吴军:人类的胜利—-评AlphaGo和李世石之战

2016年3月9日,Google(或者叫Alphabet)公司开发的具有“深度思维”的下围棋机器人AlphaGo在同世界著名选手李世石的对局中,中盘获胜,成为第一个战胜围棋世界冠军的机器人,这是继1997年IBM深蓝战胜卡斯帕罗夫后,人类在机器智能领域取得的又一个里程碑性质的胜利。至于为什么这两件事情前后差了近20年的时间,因为对机器来讲,下围棋要比下象棋难得多,如果从计算量上量化一下它们的差距,大约相差10的六次方到10的九次方倍,如果我们取一个平均数,大约是一亿倍左右(至于怎样确定是10的六次方到10的九次方,在我的新书里会讲)。当然,还有一个因素就是计算机科学家开始认真研究围棋算法要比研究国际象棋晚很多。这样,计算机的两次获胜相差了20年。

从计算机发展的角度看,智能机器在所有棋类战胜人类其实只是一个时间的问题,因为机器运算能力的提升是指数增长的,而人类智力的提升能做到线性增长就不错了,因此一定存在一个时间点,很多人原先估计围棋战胜人类的职业棋手需要再等十年,但是去年底Google提前实现了这个目标,这有点出乎人的预料,当然这次战胜李世石更出乎人们的预料。

至于计算机是如何战胜人类的,我其实在很多次公开的讲座中已经讲到,机器获得智能的方式和人类不同,它不是靠逻辑推理,而是靠计算。具体讲这里面有两个关键的技术,首先是一整套把棋盘上当前的状态变成一个获胜概率的数学模型,当然,这件事没有大数据是做不到的。AlphaGo在短短的时间里学习了几十万盘人类对弈,才训练出非常有效的数学模型。我的一位同事打开下棋的程序,想看看是否能通过研究那些程序提高棋艺,后来他发现完全没有可能,里面是一堆莫名其妙的,被仔细调整的参数。第二个关键技术是一个被称为bean search的精准搜索最佳走发的启发式搜索算法。我们知道如果下国际象棋,在每种状态下大约有5-10种左右合理的走法,如果计算机往前考虑十步,这个搜索空间是100亿,大得不得了,因此计算机不能穷举所有的可能性,而是要根据从以往对弈中学来的知识,比较准确地聚焦在一个宽度有限的空闲,这就像光束一样,因此叫做Beam Search。围棋的走法每一步都多出大约一个数量级,如果往后看个十几步,状态的数量是呈指数爆炸式的增长的。尽管今天的计算机比20年前能力提升了上万倍,而且Google数据中心的服务器数量远比当年IBM深蓝里面的处理器多得多,但是如果没有好的搜索算法,是无法在很短的时间里算出最佳行棋步骤的。因此,下围棋既可以说是一个机器智能的问题,也可以说是一个大数据和算法的问题。至于Google深度学习和深度思维的原理,大家可以阅读拙作《数学之美》。

AlphaGo第一场胜利的意义非常大,它标志着机器智能得到了一个新的水平。尽管有人认为李世石有希望反败为胜,或者有人酸溜溜地讲我们还有更好的选手可以战胜AlphaGo。但是按照它的在过去几个月里的进步速度,只要Google愿意继续投入,估计一年内任何人类的围棋高手都无法和它过招了。从此,计算机实际上完成了在一个新的领域全面超越人类。在这个过程中,很多计算机科学家和工程师为此做出了巨大的贡献,他们是我们文明的缔造者。因此AlphaGo的胜利,实际上是计算机科学家的胜利,也是人类的胜利,在这场胜利中,李世石其实起到了一个Beta测试者的作用,他其实是AlphaGo这个版本的试用者。因此,Google的成功里面也有李世石的功劳。

AlphaGo的获胜让一些对机器智能不了解的人开始杞人忧天,担心机器在未来能够控制人类。这种担心是不必要的,事实上AlphaGo的灵魂是计算机科学家为它编写的程序。我在很多次演讲中一种强调一个观点,机器是不会控制人类的,但是制造智能机器的人是可以的。而科技在人类的进步中总是扮演着最活跃最革命的角色,它的发展不是什么人,什么国家能阻止的,我们所能够做的就是面对现实,抓住智能革命的机遇,而不是回避它、否定它和阻止它。未来的社会,一定属于那些具有创意的人,包括计算机科学家,而不属于掌握一个技能做重复性工作的人。

最后需要指出的是,在朝鲜半岛上我们最近看到两种趋势,一种是进步的力量,他们在帮助科技发展,弘扬东方古老的文化,我由衷地对李世石和很多韩国朋友表示敬意;另一种力量是专制而近乎疯狂的行为,这就不多说了,这种邪恶的力量即使看上去强大,在历史的长河中,无非是徒增笑耳罢了。

镜像链接:谷歌镜像 | 亚马逊镜像

分类: 科技 标签:
  1. 林夕
    2016年3月11日11:08 | #1

    机器是不会控制人类的,但是制造智能机器的人是可以的。

    未来的社会,一定属于那些具有创意的人,包括计算机科学家,而不属于掌握一个技能做重复性工作的人。

  2. 匿名
    2016年3月11日12:23 | #2

    唠叨那么多废话干嘛,不如多看看棋谱~双方各有精妙之处也各有失误臭棋:

    AlphaGo vs 樊麾
    五局棋谱下载:
    https://storage.googleapis.com/deepmind-data/assets/alphago-tournament/SGF-Files-2016-02-04.zip

    AlphaGo vs 李世乭
    第一局棋谱下载:
    https://gogameguru.com/i/2016/03/Lee-Sedol-vs-AlphaGo-20160309.sgf
    第二局棋谱下载:
    https://gogameguru.com/i/2016/03/AlphaGo-vs-Lee-Sedol-20160310.sgf

    用Windows商店里的免费应用 SgfEditor 可以打开SGF棋谱文件

  3. ringo
    2016年3月12日23:51 | #3

    谢谢楼上提供棋谱,也希望吴军先生第六本书早日推出。

  4. ringo
    2016年3月13日11:04 | #4

    AlphaGo vs 李世乭
    第三局棋谱下载
    https://gogameguru.com/i/2016/03/20160312-Lee-Sedol-vs-AlphaGo.sgf

  1. 本文目前尚无任何 trackbacks 和 pingbacks.