破破的桥:谷歌内部小道消息暗示,AlphaGo这个版本棋力已经天下无敌了

3月10日

今天又去看了知乎上开赛前的预测。第一盘结束后,几个预测AlphaGo会赢的答案明显投票靠前,除李开复老师自带3000票赞成谁都比不过。我那篇短文排第七。排我后头的是位更激进的Google工程师,他立的Flag能把很多人气死——“樊麾将是最后一个战胜过顶级电脑围棋的人类”,所以反对票太多被排后头了。

56fc0caagw1f1rdj9v57qj20i205q40e

3月11日

今天又去知乎上仔细阅读了这个帖子的评论。无意中点开作者头像,发现居然是和我同一个中学有点小交情的师弟。马上加好友转着圈问了一堆问题。虽然很多东西要保密未能告知,但我已经把事情基本搞清楚了。

打听少量消息后的个人猜测:1.李世石等级分elo约3530,世界第一柯洁约3630。AlphaGo预计在4000以上,是有史以来棋力最高的物体。李赢面小于5%。AlphaGo棋力约可授李世石两子。2.职业棋手对AlphaGo的臭棋判断基本都是错误的。3.打劫没用。

其实昨天几个网站的职业解说很能说明问题(古力和刘星的解说都是这样的):双方差不多均势,李世石这儿便宜了,这儿也便宜了,居然连这儿也走到了。咱们点点目吧。咦?怎么亏了一个贴目?

你们对比一下这一轮质疑李世石(特别是打劫,那些职业棋手质疑李世石不打劫,但因为后者的卓著声誉,又不能直说他被买通了,憋得很难受。)和当时质疑樊麾放水是不是很像?不是这么回事。打劫这招樊麾早就用过了,没用。李世石状态也很好,他是被压制了。

解答下疑问:1.AlphaGo未存储任何棋谱,它只是套训练出来的带权重的神经网络(若你能把该网络背熟后计算可立升业余三段)加蒙特卡罗。2.等级分elo是套科学估算实力的系统,根据过往战绩计算得出。elo差200的两个人胜负比率约为3比1。AlphaGo可以通过新老版本对战确定其等级分。

我估计比赛结束后Demis会透露AlphaGo的等级分到底多少。因为这信息是保密的我问不到,所以上文是猜的。

现在围棋并没有公认的等级分系统,所以很难公布这个值吧?

欧洲有的,中日韩台可通过相似方式算出。另外AlphaGo各版本的等级分在Google的内部PPT中已展示,但因为保密不能说,我问不出来。只说有非常惊人的现象。

也可以这样理解:对于这个超级复杂问题,李、柯用1.5kg蛋白质和磷脂,就逼近到全局最优的大概70%,真是奇迹!至今原因不明!

这就是人工智能的奋斗目标吧。

镜像链接:谷歌镜像 | 亚马逊镜像

分类: 科技 标签:
  1. 匿名
    2016年3月11日12:42 | #1

    唠叨那么多废话干嘛,不如多看看棋谱~双方各有精妙之处也各有失误臭棋:

    AlphaGo vs 樊麾
    五局棋谱下载:
    https://storage.googleapis.com/deepmind-data/assets/alphago-tournament/SGF-Files-2016-02-04.zip

    AlphaGo vs 李世乭
    第一局棋谱下载:
    https://gogameguru.com/i/2016/03/Lee-Sedol-vs-AlphaGo-20160309.sgf
    第二局棋谱下载:
    https://gogameguru.com/i/2016/03/AlphaGo-vs-Lee-Sedol-20160310.sgf

    用Windows商店里的免费应用 SgfEditor 可以打开SGF棋谱文件

  1. 本文目前尚无任何 trackbacks 和 pingbacks.