首页 > 资讯列表 > 科技资讯 >> 智能设备

开发人员释疑:跟柯洁对战的AlphaGo到底有多强

智能设备 2017-05-24 12:02:07 转载来源: IThome

站搜网5月24日消息 在中国乌镇举行的围棋峰会已经进入第二天,在今天举行的人工智能高峰论坛上,Deepmind的首席程序员席尔瓦向公众介绍了AlphaGo的强化学习方式,以及相比于去年同李世石对战的AlphaGo Lee,今年同柯洁对战的AlphaGo Master到底强在了哪里。根据席尔瓦介绍,谷歌在训练AlphaGo时,是通过人类专家进行监督式学习,再通过策略网络实现强化学习输入价值网络

站搜网5月24日消息 在中国乌镇举行的围棋峰会已经进入第二天,在今天举行的人工智能高峰论坛上,Deepmind的首席程序员席尔瓦向公众介绍了AlphaGo的强化学习方式,以及相比于去年同李世石对战的AlphaGo Lee,今年同柯洁对战的AlphaGo Master到底强在了哪里。

根据席尔瓦介绍,谷歌在训练AlphaGo时,是通过人类专家进行监督式学习,再通过策略网络实现强化学习输入价值网络。AlphaGo树搜索通过策略网络减少搜索的宽度,以价值网络减少搜索的深度。

与李世石对战的AlphaGo Lee在谷歌云上有50个TPUs在运作,搜索50个棋步为10000个位置/秒,而昨天打败柯洁的AlphaGo Master是在单个TPU上进行游戏,AlphaGo成为自己的老师,它从自己的搜索里学习,有着更强大的策略和价值网络。

简单来说吧,按照Deepmind团队的预测,与柯洁对战的AlphaGo Master要比去年同李世石对战的AlphaGo Lee强三个子。

在昨天的对战中,柯洁最终是以1/4子的劣势输给谷歌了AlphaGo Master。

对此,柯洁也在微博上感慨“我到底是在和一个怎样可怕的对手下棋...”。

柯洁微博全文如下:

早就听说新版alphago的强大....

但...让...让三个?我的天

这个差距有多大呢?简单的解释一下就是一人一手轮流下的围棋,对手连续让你下三步...又像武林高手对决让你先捅三刀一样...

我到底是在和一个怎样可怕的对手下棋...

标签: 开发 人员 释疑 跟柯 AlphaGo 到底 有多


声明:本文内容来源自网络,文字、图片等素材版权属于原作者,平台转载素材出于传递更多信息,文章内容仅供参考与学习,切勿作为商业目的使用。如果侵害了您的合法权益,请您及时与我们联系,我们会在第一时间进行处理!我们尊重版权,也致力于保护版权,站搜网感谢您的分享!

站长搜索

http://www.adminso.com

Copyright @ 2007~2024 All Rights Reserved.

Powered By 站长搜索

打开手机扫描上面的二维码打开手机版


使用手机软件扫描微信二维码

关注我们可获取更多热点资讯

站长搜索目录系统技术支持