2017 年 5 月 23 日,在举行于中国乌镇的“人机终极对决”第一局中,当今世界排名第一的中国围棋选手柯洁,输给了 Google 旗下的人工智能程序 AlphaGo。
按照比赛规则,柯洁和 AlphaGo 各有三个小时的时间;但在现场的比赛中,整体的节奏比预想中的要快很多。尤其是 AlphaGo,它的平均出子时间为 30 秒左右,现场解说的职业八段棋手和职业九段棋手常昊多次用“高效、果断”来评价它的表现。而柯洁的应对状况比较多变,有时会立刻下子,有时也会思考很长时间。
爱范儿(微信 ID:inr)在现场注意到,当柯洁用时一个小时的时候,AlphaGo 所用的时间不到二十分钟。
最终比赛的结果也并不十分出人意料,在比赛进行了四个多小时之后,柯洁九段执黑负于 AlphaGo,AlphaGo 赢四分之一子。
不过,关于这场“人机终结对决”的最终结果,目前还存在一定的变数;今天只是这场对决的第一局,第二局和第三局将分别在 5 月 25 日和 5 月 27 日举行,爱范儿(微信 ID:inr)将保持关注。
关注微信号爱范儿(微信号:inr),回复关键词「阿尔法狗」,获取 AlphaGo 下围棋的干货,了解机器学习和深度学习的区别。
今天的比赛之后,柯洁还将在 25 日和 27 日进行对 AlphaGo 的后两盘对决,无论第二局输赢,三盘比赛都将完成,与之前 1 月份 Master 的 AlphaGo 要求下快棋不同,本次比赛采用传统规则,双方各有三小时的时间。
直到本次“中国乌镇·围棋峰会”,已是 AlphaGo 第三次刷屏,前两次人机对决的场景还历历在目,但整个人类世界对于两方选手的感情却发生了性的变化。
2016 年 3 月,AlphaGo 首次挑战韩国棋手李世石时,整个世界都希望 AI 获胜,就像柯洁当时所说,“就算阿法狗赢了李世石,它也赢不了我”,大家以看热闹的心态打量着新生者 AI。
而当 2017 年 1 月, Master 的 AlphaGo 在互联网上连扫世界第一柯洁、韩国冠军朴廷桓、日本冠军井山裕太时,AI 似乎已经不可战胜,柯洁也在微博深夜感慨“人类千年的实战演练进化,计算机却告诉我们,人类全都是错的……”
直到今天,当柯洁在赛前说到“能够代表人类出战,是我以前不敢想象的事情,这次选择我作为主角,我也会竭尽全力去一争胜负”时,世界的选择已经变成了希望人类赢一盘。
这种心态在赛制上也有所体现,除了代表中国选手最高水平的柯洁个人之外,新加入的配对赛和团体赛也非常值得关注。
配对赛将由古力九段、连笑八段两位当中的一人分别与 AlphaGo 组队,再与剩下的一人进行对决,每方只有 1 小时时间,比赛在 26 日上午打响。
团队赛则是时越、芈昱廷、唐韦星、陈耀烨和周睿羊 5 位世界冠军组类联队,合力对抗 AlphaGo,每方 2 小时 30 分钟,这将在 26 日下午进行。
当 1 对 1 的对决已经过于,人机组队又会擦出怎样的火花,人类联合组成的“神经网络”面对 AI 又是否还有胜算呢?
千万别以为“坐”在场上对弈的双方一年来都没有变过,用很哲学的说法来说,他们都已经不再是当年那个存在。
自从今年 4 月确定了本次人机对决之后,柯洁已经有意识地在寻找对抗 AlphaGo 的“神之一手”,在先前进行的新奥杯世界赛和中国围甲联赛中,柯洁在 8 盘比赛中输掉了两盘,而这两盘中出现了一些之前并不常见的运子方法,有观察者表示这是柯洁在尝试以传统套之外的方法寻找 AlphaGo 的软肋。
但 AlphaGo,恐怕在以令人的迭代速度进化着。同样在今年 4 月,AlphaGo 之父哈萨比斯在英国剑桥大学进行了,专门提到为了帮助 AlphaGo 提升,他们还开发了名为 Anti-AlphaGo 的防止过拟合的工具,之前 AlphaGo 提升一个版本需要 3 个月,现在只需要 1 周。
AlphaGo 对阵李世石时的版本号是 V18,而当下的版本估计已经到了 V60,在逻辑上和棋局策略上已经今非昔比。
如果读过人工智能的科普文章的线 月,IBM 的 “深蓝”计算机在国际象棋中战胜了世界排名第一的卡斯帕罗夫。
但这在围棋面前就是小巫见大巫了,围棋共有 19X19 个落棋点,加上不同的落字方式,全部可能大约是 10 的 170 次方左右,根据荷兰科学家 John Tromp 的计算,大约是 840935。
大家知道,困扰人类很多问题的原因在于算力,比如一个密码锁,如果只有两位,那么如果忘了密码很多人都会尝试去从 00 试验到 99,但 4 位数的手机密码就没几个人去试了,因为试出来花的时间太长,这就是算力不够。
对于现在的 AI 来说,对弈国际象棋所需的算力已经基本达到,但是用穷举法算出来围棋的各种可能的算力还没达到,这种情况下,就要考虑算法了。
这就是蒙特卡洛搜索算法,我们明白,很多时候两人对决,其实不需要每一步都走当时最好的那一招,只要出的招是妙招,或者比对方能想象的好就行。这时候,就是一个概率问题。
举个非常简单的例子,从你家到火车站共有 ABCDE 五条,或许你不知道每条具体的长度和用时,但此时,如果从你家同时出发 500 人,每条 100 人,然后你到火车站去观察,假设半小时内到达的人里,走 B 的最多,你就可以断定走 B 是条好。
当然,越多,口越多,这种情况的分析会越复杂,但是放出的人越多,结果也会越精确,虽然没有人能打包票说某条一定是最对的,但是分析结果足够做决策了。
而深度学习,指的是 AlphaGo 会根据之前人类棋手的大量历史棋局,记录下每个棋局当中的分步局面,并把当前的棋局按照进行视觉分析,跟以往的数据进行比较,找到最类似的局面,再在当前最高质量的点上去下子,不至于把所有的都考虑一遍。
而当下版本 AlphaGo 最骇人之处,在于它已经跳出了学习人类棋盘的方法,而进入了自己左右手互搏,自己学习各种情况的局面,一方面它所学习到的棋局广度类可想象,另一方面它的出招可能越来越没有“套”可言。
更别提 AlphaGo 只要有电就可以无休止学习这件事了,由于围棋本身有明确的规则判断胜负,所以 AlphaGo 可以在无需人类标注的情况下就能判断自己出招的好坏,更是强化学习的一大优势。
赛前有认为,这是为了向社会继续推广 AI 的概念,为行业的发展做宣传,这种说法虽然都有一定的合,但格局未免太小。
而进行 AI 于人类的对抗,根本目的还是检验和优化算法,并且力争在其他更有价值的行业中进行应用。
就像在《智能》一书中,李彦宏说的那样,“2017 年初,AlphaGo 的变身 Master 中韩高手,一时间人们分化为悲观派、派、冷静派、脑洞派……我们希望有更多人是默默学习派”。
从最初的 AlphaGo,到 Master,再到今天的 AlphaGo,三代产品,三段历程,对应的恰好是“理论,实验,再创新”的三段论。
Google 大中华区总裁石博盟就透露,AlphaGo 的第一个结合点会是医疗领域,AI 将在一定准确率的情况下,给予医生诊疗判定方面的辅助,对于糖尿病、癌症等疾病的治疗和研究大有裨益。
而未来在更大的深度和广度上,AlphaGo 积累的决策模型,将逐渐把人力从需要反复的劳动中解放出来,同时对脑力劳动进行反哺,对绝大多数社会元素进行快速解构并解读,再反馈给人类。
如同去年大热的科幻片《》中,人和外星人最终的结果一样,人工智能与人类本体,终将会找到一条智慧结合的发展大。
在今年阅读到 Jacob Bronowski 的 The Ascent of Man 的时候,被他所写到的生物界中,只有人可以远离他所诞生的,甚至在极端不适合的地方生活所,人之所以能够具备现在的能力,必然是与其敢于离开自己的舒适区有关。而艺术,爱,智商,想象力,创造力这些似乎都不能是必要条件,而更像是在数十万年中,人类在不断和追寻梦想的过程中所进化出的特质。
智能是人可以步入今日之成就的必要条件,但非充分条件。机器智能想必也会如此,大多数是不会具备人的意识的,但是不可排除的是,随着时间的推移,其中有些会开始,拥有意识,开始,和追寻梦想,也会有贪嗔痴,真善美。
推荐: