第两千九百八十三章 乱拳打死老师父(1 / 2)
('“研发围棋软件,还是足以挑战围棋一流高手的围棋软件,怎么可能绕得开中国棋院?”周至反问道:“棋院的领导们对我们的想法是大力支持的,虽然他们认为小智想要拥有和他们对弈的能力,基本上不大现实。”
“棋圣给你们的答案是啥?他总不会说自己下棋是靠直觉吧?”杨宏辉笑道。
“诶!还真给你说对了,就是靠的直觉。”周至说道:“不过这种直觉是经过成体系训练之后的直觉行为。”
“而且不仅仅只有他这么说,好几个九段都说他们是靠直觉那样走的,具体原因也无法描述。”说道这里周至就得意起来了:“不过我们小苗却用数学语言,大体解释清楚了这种思维的形成过程。”
“你的意思是说,小苗可以用计算机把人的思维摹拟出来了?”梁红吓了一大跳:“你们那个小智,已经能够像人那样思考了?”
“我去!终结者吗?!”杨宏辉更是联想到了这几年那部火到不行的大片。
“没有那么夸张了。”周至笑道:“准确的说是让小智的神经网络得到一定的训练,然后通过大量围棋棋局的学习,去预测人类下一步将要做出的决定,对人类可能做出的前五步或者前十步的位置进行概率的判定。”
“这里涉及到两个神经网络的体系,一个是决策网络体系。我们利用网上成百万盘的围棋游戏的棋局,通过监督学习,我们让小智获得了判定能力,可以模拟人类下围棋的行为;”
“从棋盘上任意选择一个落子点,训练系统去预测下一步人类将作出的决定;系统的输入是在那个特殊位置最有可能发生的前五或者前十的位置移动;这样,只需看那最近的五到十种可能性就好,而不用分析全部的两百种可能性,这就极大地降低了运算量。”
“一旦小智学会了这个,我们便可以引入误差加强学习,对系统进行几百万次的实战训练。对于赢了的情况,让小智意识到,下次出现类似的情形时,就可以做出相似的决定。相反,如果输了,那么下次再出现类似的情况,小智就不会选择这种走法。”
“形成决策神经网络体系后,我们就可以开始第二个构建神经网络体系——数值体系。”
“如果说决策体系是为了形成‘直觉’,数值体系就是对‘直觉’进行量化,通过百万次的游戏,对系统进行训练,让小智对不同的落子点,经过置信区间学习,将赢几率定义在0到1之间,0表示根本不可能赢,1表示百分之百赢。让小智统计几率。”
“最终的结果就是把这两个神经网络结合起来,我们可以大致预估出当前的情况。这其实和高手学习围棋的过程很类似——通过严格的训练,比如打谱和局部拆解,研究透近几步的最优下法,然后形成人脑里边的‘类直觉决策’。”
“不过人脑对信息的处理能力可谓夸张,而且面对的情况也是多种多样的,即便小智最后能够达到围棋九段的能力,那也仅仅是人类上百万种能力中的一种而已,终结者里机器人那种和人一样拥有夸张的信息处理能力,只能是一种想象。”
“不过话也得反过来再说一遍,虽然小智的能力没法与人脑相比,但是无论是硬件架构,软件体系还是算法思路,都是人类科技的一大进步,是远超深蓝,银河这种传统算力解决方案的跨时代的技术思路,其重要性……我觉得大概得相当于牛顿前后的物理学分野吧。”
“哇?那小苗就是活牛顿了?”梁红都傻了。
-->>(本章未完,请点击下一页继续阅读)