简单说一下AlphaGO，不捧不吹，纯介绍+科普【alphago吧】

alphago吧关注：817贴子：4,607

5回复贴，共1页

简单说一下AlphaGO，不捧不吹，纯介绍+科普

主要是有些人不懂AlphaGO的原理，
导致于进入很多误区和错误的解读。
所以我就简简单单的说一下AlphaGO的基本理论。
首先有几点要澄清的是：
1.它这做法不是穷举，而是用模拟『天演论』的方式进化的。
2.它只知道围棋规则，不懂定式、套路。
3.可以把它想像成人类历史上第一个学习、玩围棋的怪胎。
4.它的核心概念是靠着『机率之神』的帮忙，渐渐逼近『围棋之神』的。
5.这是一套『模拟人类学习过程』的软体，下围棋只是顺带的。
6.在此之前它都只是在尝试一些小游戏，google感觉可行，所以这次搞围棋。
7.它自己的那一套下棋模式，不是建立在围棋理论上面，而是建立是『尝试经验』上面。

送TA礼物

IP属地:中国台湾

1楼2016-03-14 15:12回复

这种模式下来，有几点就很容易理解的
●AlphaGO它的命脉是"机率"，它能进化也是靠机率产生多样性。
●它并非不会出错，因为有机率抽到劣棋，只是若它进化过很多次的话，抽到的机率会很低。
它是由完全不懂围棋，靠着天演论进化到现在这种程度的，
演算法模拟的是一个『自然环境』，而淘汰的契机就是『每一次胜负的结果』
所以开发团队才会说完全不知道它会怎么下，毕竟这全靠机率。
人类下棋，是建立在前人累积的精华上，
在加上自己亲身的经验锻炼来的棋感、棋风，
最后在配合上人脑的计算，单论『起步点』人类就比AlphaGO高了，
但问题在于人类的进步太慢了。
不可否认AlphaGO的方法如果用在人身上，一定会更没有效率，
但是它是台机器，所以它可以实现这种人类无法实现的练棋方式，
当然它之所以只能用这种方式，就是因为它没有人类的逻辑能归纳出围棋理论。
【【【【【AlphaGO会输的真正原因】】】】】
第四局AlphaGO会被击败，真正的原因在于『算错79～87歩』的胜率，
它是错在算错『胜率』，也就是它79～87歩眼瞎了。
也就是说，我们目前可以质疑：『它的胜率机算方式，有问题。』
但不能就此认为『靠胜率判断落子』这个逻辑是错的。
第四局会获胜，就是因为李40下的棋，
超乎了AlphaGO的计算，导致它算错胜率，后来才步步错。
但要注意，它犯的错是算错胜率，而不是『靠胜率判断落子』这个决策的错误。

IP属地:中国台湾

3楼2016-03-14 15:12

那也许有人会问了，那为什么AlphaGO到后面时会乱下?
那边会乱下不是因为BUG，而是因为无力回天，
每个地方胜率都很低，所以它就随机选地方下，
一直下到它判断的胜率到了投降的临界点，它才会投降。

==================================================
我是希望大家理解一下，它不是人，
它走的道路也不是建立在我们的理论上，
它是一个从零开始，靠着《天演论》进化到现在的....
所以尝试用人类数千年建立下来的围棋理论去理解它，
是搞不懂的，因为进化的路线就不一样。
所以它难算清的路，人也许很容意算清，
人看不清的路，它也许觉得很简单。
要注意一点，
它的生成方式，就注定了，它也会犯错(毕竟靠机率)。

IP属地:中国台湾

4楼2016-03-14 15:13

晚上看

IP属地:湖南

来自Android客户端5楼2016-03-14 17:02

阿尔法狗是自己和自己下，类似周博通的左右手互搏，而不是两台阿尔法狗对下

来自iPhone客户端6楼2016-03-14 17:14

顶上去

IP属地:江西

来自Android客户端7楼2016-03-14 20:31

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

5回复贴，共1页

<返回alphago吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

简单说一下AlphaGO，不捧不吹，纯介绍+科普

登录百度账号

扫二维码下载贴吧客户端