AI自学3天胜出人类千年?
2017-11-02

文/岳超

北京时间10月19日凌晨,谷歌旗下的人工智能公司DeepMind在世界顶级科学杂志Nature杂志上宣布:新一代AlphaGo zero可以在没有人类干预的情况下自我学习,而且仅自我学习了3天,就以100比0的成绩战胜了第一代AlphaGo。AlphaGo项目的主要负责人戴维‧席尔瓦(David Silver)在接受采访时表示,“过去人们普遍认为机器学习是基于海量的大数据,但是从AlphaGo Zero身上,我们发现算法比数据更重要”。

AlphaGo于2015年10月面世,在广为人知的与棋手李世石对弈之前,它已经打败了欧洲围棋冠军樊麾。樊麾接受《财经》记者采访时表示,当时在他看来,一个计算程序要打败职业棋手是不可能的事情。

结果他以0-5输给了AlphaGo,但他也因此加入了DeepMind团队,帮助训练AlphaGo。2016年3月,在他帮助训练下的AlphaGo以4-1的成绩打败了人类顶尖棋手李世石。2017年初,AlphaGo化名为“Master”,在网络上挑战60名人类棋手,保持全胜的成绩。2017年5月,在乌镇的,名为Master的第二代AlphaGo以3-0战胜了目前人类最强棋手柯洁。

然而,仅仅在5个月后,第三代AlphaGo zero横空出世,仅仅自学了3天,就分别击败了第一代AlphaGo和第二代AlphaGo Master。面对无师自通碾压一切前辈的AlphaGo Zero,柯洁说出了这样一句话:“人类显得太多余了……”。

柯洁被认为是围棋天才,6岁开始学棋,17岁时在世界范围内排名第一,一个人类天才十几年的学习,被Alpha Zero用3天时间超越。

被震动的不止柯洁,在DeepMind的Nature论文公布之后,悲观、甚至恐慌的情绪,在大众之间蔓延著,甚至有媒体一本正经地探讨“未来是终结者还是黑客帝国”。

人控的“无师自通”

那么,在AlphaGo Zero下棋的过程中,人类知识和经验真的一点用都没有吗?事实并非如此。

据业内专家介绍,在AlphaGo zero下棋的过程中,并没有从人类的对局经验和数据中进行学习,但这个算法依然需要人类向它灌输围棋的规则:哪些地方可以落子、怎样才算获胜等等。

和之前三版AlphaGo相比,这一版去掉了人类教授棋谱的过程,在训练过程最开始的时候,AI落子完全是随机的,AlphaGo团队的负责人David Silver透露,它一开始甚至会把开局第一手下在1-1(棋盘上不占目数的位置)。在和自己对弈的过程中,算法才逐渐掌握了胜利的秘诀,并做到并前一代更优秀。从这个角度来看,Zero的确可以说是第一次做到了无师自通,也正是出于这个原因,DeepMind这篇Nature论文才能引起这么多圈内人关注。

然而,AlphaGo zero虽然在棋盘上“威风八面”,但具体的围棋规则、和以围棋规则判定棋局输赢,依然需要人类来预先“设定”。所以有人说“人类无用”、或者说“机器可以自己产生认知”,都是对AlphaGo Zero错误理解。

“全面碾压人类”实为空谈

AlphaGo zero发布之后,媒体关切地询问“这个算法以后会用在哪些其他领域”,网友认真的担心“这个AI(人工智能)会不会在各个领域全面碾压人类”。

对于AlphaGo zero算法的未来发展,DeepMind联合创始人哈萨比斯介绍说,AlphaGo团队的成员都已经转移到其他团队中,正在尝试将这项技术用到其他领域,“最终,我们想用这样的算法突破,来解决真实世界中各种各样紧迫的问题。”

DeepMind期待AlphaGo zero解决的,是“其他结构性问题”,他们在博客中特别列举出几项:蛋白质折叠、降低能耗、寻找革命性的新材料。

哈萨比斯说AlphaGo可以看做一个在复杂数据中进行搜索的机器,除了博客中提到几项,新药发现、量子化学、粒子物理学也是AlphaGo可能大展拳脚的领域。

然而,AlphaGo zero在围棋领域获取的成就,能否真的能迅速移植到其他领域呢?

有专业人士认为,要解释AlphaGo算法能扩展到哪些领域,需要先了解它现在所解决的问题——围棋——具有哪些特性。首先,围棋可以复盘,是能够完美重现的算法模型;其次,围棋对弈双方只有2个,信息是完全可观测的,不像在麻将、扑克里,对手的信息观测不到;最后也是最重要的一点:围棋对局可以用计算机迅速模拟,很快地输出输赢信号。

这些围棋特性,对于AlphaGo算法的影响至关重要,他们和AlphaGo算法很一致,能快速输出结果反馈,因此才有了AlphaGo ZERO创造的“无师自通”的奇迹。

对比其他领域,几乎都比围棋要复杂的多。例如DeepMind期待AlphaGo zero未来解决的“发现新药”问题。发现新药和下围棋之间有一个非常显著的区别,就是“输赢信号”能不能很快输出:“新药品很多内部的结构需要通过搜索,搜索完以后制成药,再到真正怎么去检验这个药有效,这个闭环非常代价昂贵,非常慢,你很难像下围棋这么简单做出来。”

当然,如果找到快速验证新药是否有效的方法,这项技术就能很好地用在新药开发上了——-但现阶段看,这几乎是不可能的。

这些限制,普通人看来,实在是平平常常;但对AlphaGo的算法来说,则是致命的限制,让其强大的“自我学习”能力,施展不了。我们也不难推想,AlphaGo zero在某些小领域内可以做得非常好,但其实并没有“全面碾压人类”的潜力。

综上所述,分析人士认为,AlphaGo Zero的工程和算法确实非常厉害。但千万不要对此产生误解,认为人工智能是万能的,所有人工智能都可以无需人类经验从零学习,得出人工智能威胁论。AlphaGo Zero证明了AI(人工智能)在快速发展,让我们看到在有些领域可以不用人类知识、人类数据、人类引导就做出顶级的突破。但是,AlphaGo Zero只能在单一简单领域应用,更不具有自主思考、设定目标、创意、自我意识。即便聪明如AlphaGo Zero,也只能是人类给下定目标后,AI(人工智能)做好数字最佳化而已。
    来源: 看中国 责编: Kitt

    上一篇: 惊传朝鲜核试场坑道崩塌 约酿200人惨死

    下一篇: Russia Obstructing US Action on North Korea


    相关新闻

    一周点击排行
    过往新闻