从Bingo看百度人工智能 一场关于未来的博弈

来源:岁月联盟 编辑:exp 时间:2014-09-22

  1997年,在IBM“深蓝”战胜国际象棋世界冠军卡斯帕罗夫之后,《时代》杂志提出了一项新的挑战:“让计算机与人类下围棋吧,它获胜的机会很小。计算机要在围棋上战胜人类,还要再过一百年,甚至更长的时间”。

  《时代》杂志绝对不会想到,仅仅是十几年后,他们眼中这个“百年难题”就被中国互联网巨头百度解决了。“我们现在做的Bingo智能围棋系统,9×9围棋上已经达到了业余六段,是准职业水平了;在19路围棋上也能达到业余一二段。”9月20日,在第五十四期百度技术沙龙上,百度公司自然语言处理部高级工程师,BINGO智能围棋系统技术负责人杨程这样说。

  今年7月25日,百度举办了“挑战Bingo”人机围棋大战。在最终的决战中,Bingo分别以两个2:1击退两名5段选手的挑战,最终以15战全胜、总盘数38胜4负的绝对优势取得胜利。而Bingo智能围棋系统,仅仅是百度人工智能发展的一个缩影,目前百度很多被业界使用的技术,比如说语音识别、海量识别、智能推荐,都是跟人工智能有关。习近平主席曾说,人工智能是第三代技术,麻省理工学院科技杂志也将人工智能技术列为十大通用技术之首。而如今百度正在人工智能领域取得最突破性的进展并且迅速在互联网界产生影响。

  

 

  长期以来,计算机围棋是计算机科学领域公认的最具挑战性的研究课题之一。这个难题困扰了人类几十年,如今,百度Bingo朝着这个方向迈出了坚实的一步。

  打破常规,独创算法成突破关键

  为什么计算机更擅长国际象棋,而在围棋上遭遇到困难了呢?人工智能依靠对棋盘上不同位置进行搜索分析、并找出棋盘上的“重点位置”,来决定自己落子的位置与套路,这也是“深蓝”战胜国际象棋大师的方法。与国际象棋不同的是,19路围棋的空间复杂度比国际象棋复杂10的120(+)次方倍,;更严重的问题是,没有人能够用计算语言说清楚棋盘上哪个地方是重点,一个子的好坏或许要到几十步以后才显现出来,甚至与盘上十几格以外的子有关。在国际围棋中风光无限的“阿尔法贝塔搜索”已不足以应对围棋的复杂性。在这种情况下,百度Bingo的独特算法成为了计算机围棋突破的关键。

  进入21世纪,基于蒙特卡洛树状搜索的UCT算法一直被业界视为解决计算机为其问题的关键,但UCT算法同样存在着取样量巨大、运行缓慢的致命问题。在UCT算法的基础上,杨程老师及其团队进行了大量的优化改进,最终提出了全新的学习算法,并成功应用于Bingo系统中。在相同时间内,新算法可以产生比UCT多若干倍的统计值,这可以大大加快Bingo的在线学习速度;其次,杨程和他的团队还定义了一种弱化形式的Alpha-Beta搜索,将其与在线强化学习和离线监督学习结合起来,并成功地嵌入到蒙特卡洛搜索当中,这使得探索更加深入地往极具前景的方向发展。“因为统计值多了,所以Bingo学习很快,而且基本上成功地实现了Rapid Action…可能的胜率在百分之七八十左右。”在谈到新算法带来的改进时,杨程说。

  “自学成才”,计算机学下围棋无需高手调教

  杨程也是一位围棋热情爱好者,但想要让自己开发出的百度Bingo达到战胜职业棋手的水准,仅仅依靠爱好者的经验调教显然是不够的。那在Bingo的开发过程中,百度是否专门为之请来了围棋高手进行一对一教学?

  答案是否定的。Bingo系统采用了监督学习的方法,利用在线学习,自动归纳总结每一局棋的每一步落子哪里好,哪里坏。结合机器学习与搜索技术,Bingo会自动棋局进行分析,并对自己的棋路进行评分,长期竞赛积累的上万、至几千万的“学习经验”都将汇总归纳进算法公式中,并以此形成新的对弈策略。对除此之外,来自职业棋手的海量棋谱也是Bingo学习的“参考资料”。

  “我们希望(在开发智能系统时),开发者不需要很高深的知识,只通过纯粹技术,就能让计算机具备相应的智能能力,我想这就是我们人工智能所追求的目标。”杨程说。

  在百度,像杨程这样致力于人工智能研究的人还有很多,经过这些科学家不懈的努力,百度在人工智能领域也取得了不少突破,比如百度的图像识别能力已经做到了全球一流水平,稳坐国内第一把交椅,识别度达到92%左右,超过了过去15年识别率增幅的总和。

  发散思维 Bingo技术助推一线产品

  在作为计算机最前沿领域之一的人工智能研究中,解决一项理论化的问题的时候,往往将同步产生很多与之相关的分支理论和技术,并在不同的学科与产品之间建立沟通的桥梁,而这也是高尖端科研最重要的现实意义。“数学上‘四色定理分割地图’的问题实际上现在已经基本上被解决了,但是在这个解决的过程中并没有诞生太多新东西,所以数学界也认为‘四色定理’不是一个特别好的问题。”在论及这一点时,杨程评论说。百度Bingo系统所致力的,不仅仅是要攀登计算机围棋问题的高峰,还要将这项技术最大化的应用于产品之中。

  这一目标,Bingo同样做到了。Bingo智能围棋系统中应用到的前沿搜索技术,已经被应用到生物统计,包括经典规划,网页搜索,个性化推荐等等百度旗下相关产品之中;而让Bingo更加智能的机器学习、监督学习等技术,同样也已经在PS结果主动展现、索引分层、图片搜索、知心卡片推荐、移动app推荐等产品层面中被加以广泛应用。技术的进步真正被带到了消费领域之中,百度在人工智能领域的领先优势也同样在平民化的消费市场中得到了延续和延伸。

  业界一直认为,人工智能的应用场景非常丰富,带给人们的想象空间也很大,百度首席科学家吴恩达说,谁赢了人工智能,谁就赢得了未来。如今看来,一个市值几千亿美金的公司正在向百度招手。

  百度技术沙龙是全国最早的技术开放交流活动,由百度组织策划,至今已经持续举办4年,经历了54期。百度技术沙龙一直致力于以“技术开放”的心态,分享 行业领先的技术理念和技术实践。目前,百度技术沙龙已经成为北京中高端技术人员的精神家园,百度技术沙龙希望日后能够有效推动中国互联网的技术发展与行业创新。