新闻资讯

刘知青:AlphaGo存在致命弱点 期待柯洁能找出

信息分类:行业新闻  发布时间:2017/05/16  责任编辑:围棋小编  作者/来源:新浪体育
刘知青
5月16日,北邮教授刘知青在厦门大学翔安校区图书馆举行“围棋与人工智能”讲座,介绍人工智能围棋中的深度卷积神经网络机器学习方法,讨论人工智能机器学习的应用,展望柯洁与AlphaGo的人机大战,表示AlphaGo肯定存在问题,为柯洁加油,期待他能找出AlphaGo的弱点。
刘知青表示,即使AlphaGo与柯洁对决的版本进步很多,但仍存在致命弱点。在与李世石对决之前,我就和大多数人观点不一样,认为李世石会输。这次大家都不看好柯洁,但我就持不同看法,以子之矛攻子之盾,AlphaGo自己与自己下棋,肯定有一方会输。我们也在训练人工智能网络,认为问题是存在的。柯洁应该也知道对手有弱点。我有信心看到柯洁给AlphaGo很大压力,希望能暴露出AlphaGo的问题。如《荀子·儒效》所说的百闻不如一见:不闻不若闻之,闻之不若见之,见之不若知之,知之不若行之,学至于行之而止矣。AlphaGo人工智能也是这么做的。
乌镇围棋峰会后,谷歌DeepMind团队应该会披露更多信息,目前我们仅能通过一年前战胜李世石的版本所披露的信息来分析,与柯洁对决的版本一定有更多提升。围棋对于计算机主要有两大技术困难,落子选点和形势判断。AlphaGo核心技术突破包括:使用深度学习卷积神经网络理解围棋的落子选点与形势判断;结合蒙特卡洛树搜索技术进行博弈树的搜索以选择双方最佳落子变化。
AlphaGo以策略网络用于围棋落子选点:给定围棋盘面作为输入,策略网络输出落子选点的概率分布。以数学函数方式模拟人的大脑神经元构建,AlphaGo的中间层用了13个卷积神经网络层构建,而最前沿的人工智能在中间层用了多达150层来计算。策略网络通过3000万围棋落子样例数据,使用有监督机器学习算法所训练。AlphaGo论文透露训练这3000万样例用了三星期,最近公布使用新方法极大提高了训练速度。
AlphaGo以价值网络用于围棋形势判断:给定围棋盘面作为输入,价值网络输出胜率的估计。价值网络由13个卷积神经网络层所构建,通过3000万盘围棋对弈样例数据,使用增强型机器学习算法所训练。
1959年Arthur Samuel曾说,Gives “computers the ability to leearn without being explicitly programmed,” 让计算机自己去学习。机器学习是人工智能最前沿的研究方法,人工智能的研究经历了从“推理”到“知识”再到“学习”的发展过程。机器学习已广泛应用于诸多领域:数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人等。AlphaGo采用的就是有监督机器学习(Supervised learning)。
展望未来,机器智能高速发展。机器学习将促使机器智能以指数级发展,会产生更多新型智能形态,会在不同智能形态上达到前所未见水平。人类与机器将更紧密结合在一起,机器会为人类提供更强大的智能支持。人类为机器智能的进步提供驱动力。未来机器是否具有自我驱动力,将是彻底改变未来场景的未知数。

随后的提问环节,有学生询问,AlphaGo也会自我对局,从输棋中不断进步,如何以子之矛攻子之盾?
刘知青:围棋理论上存在最优解的话,无论AlphaGo多强大,都还未达到那个程度。以子之矛攻子之盾,总是会有一方要输的,我有直觉,因做过研究,所以人工智能肯定是存在问题的。要为柯洁加油,检验出这个问题。
问:AlphaGo、绝艺、DeepZenGo的棋风不同是什么原因?
黄子忠:从我这个棋迷来看,三个软件的投入不一样,不是一个级别。
刘知青:子忠说的很对。绝艺投入非常多,而谷歌收购DeepMind投入更多。三者技术路线一样,但技术差别可以很大,比如都选用15万盘数据,但可能选择的数据参数不同,到最后实践过程中会有巨大差别。
问:最近德州扑克人工智能也打败了人类牌手,与AlphaGo孰优孰劣?

刘知青:相当于苹果和梨的比较。德州扑克与围棋都是局部有限级的内容,围棋是全部信息公开,德州扑克是不完全信息公开,但也有概率分布,能知道牌的总数,不可能有5张A,可以通过数学模型和蒙特卡洛树搜索来解决。智能有不同的智能,不必直接比较。AlphaGo使用神经网络识别围棋图像,是有广泛应用意义,比如今后识别心电图图像,所以我更看好围棋AlphaGo。

问:AlphaGo如应用到象棋,是否能强过现有象棋软件?

刘知青:本质上涉及到围棋与象棋的不同。象棋几乎是逻辑判断游戏,比如我目标就是最终的将军。围棋不仅是逻辑,很大方面是形象思维过程,识别图片的好坏,这在象棋方面非常弱。下围棋与下象棋时,人类大脑活动扫描出来是很不一样。神经网络帮助我们从形象思维方面来识别围棋,如直接将AlphaGo应用到象棋,发挥可能反而不如现有象棋软件。智能有不同形态,人工智能不是万能的,现在的人工智能强在图像识别。

问:有个识别颜色的人工智能软件,但似乎只在肤色方面非常敏感?

刘知青:不太熟悉这个人工智能软件,不过很有可能是在训练时,对人类肤色比较敏感,其他颜色的数据训练没那么多。另外,就是卷积数据核方面可能对人类肤色参数设置不同。可能今后还需要在神经网络方面调整数据集。AlphaGo在围棋某些方面可能更敏感,有些方面可能会弱一些,这就有可能是AlphaGo的弱点所在。