罡语言|软件养生|养生软件|益智软件|道德软件|北京罡阳泰克科技有限公司
公告: 量子养生调理软件(2016-07-25 19:59:32.0)   诗词辅助软件演示版:中华新韵词语(2016-02-22 11:22:50.0)   全球首创:网络组场养生软件(2015-01-27 06:51:15.0)   罡语言0.5测试版(2014-01-01 15:12:59.0)   养生系列软件试验版(2013-11-14 10:51:02.0)   上线软件产品数量统计(2013-08-14 19:00:00.0)   QQ群(2013-04-09 07:07:45.0)   开业大酬宾(2013-04-04 04:44:44.0)  
论坛 » 软件养生学高级篇——分布式(集群)系统
主题:阿尔法狗颠覆围棋世界的启示
点击:2088 回复:0
«««««««»»»»»»»

作者:创新思维 发布日期:May 31, 2017 10:22:07 AM

2017年5月23到27日,升级版的人工智能软件AlphaGo(中文称“阿尔法狗”)以压倒性的优势3:0完胜目前围棋等级分世界排名第一的中国九段棋手柯洁,中国围棋协会特授予AlphaGo职业九段证书,DeepMind创始人宣布AlphaGo“退役”,从此将不会再参加任何比赛活动。“阿尔法狗”颠覆了四千多年的围棋世界,围棋的很多理论定式判断都将被改写。标志着在围棋领域,人工智能已获得决定性的进步,创造出一个强大的工具。在其它领域,人工智能也必将取得巨大进步,创造出更多的强大工具。

实践经验是关键,谁的实践经验多谁的能力就强。
“阿尔法狗”一天可以下成千上万盘棋。人一天最多下几十盘棋。
“阿尔法狗”有上千万盘棋的经验,据说“用了2000万局的对子对弈进行训练,每一次都能提升棋力。”
人最多只有几千到1万盘棋的经验,数量级差别是巨大的,能力差别自然也是巨大的。

“AlphaGo研发者哈萨比斯的话说,就是‘AlphaGo可以模仿人类直觉’”
直觉定义:“直觉,指直观感觉;没有经过分析推理的观点。”这个定义或许是错误的。
AlphaGo是通过大量逻辑分析推理计算、综合处理之后,每一步都选择胜率最大的走,找到次优化方案,好的算法和大量的计算是基础。
目前还无法证明它选择的是否是最优化方案,需要穷举所有的走法才能证明。围棋中走法的总排列组合数高达10的171次方,目前的计算机的运算速度还做不到。
其实直觉还是经过大脑的分析推理的,只不过处理速度太快,只知道答案而不清楚过程,只是感觉不到过程而已。
人脑本身就是一部具有超高速处理的能力的超级计算机。直觉是以经验为基础的,经验越多,直觉越准。
哈萨比斯提到“直觉”也是一种类比。AlphaGo也有可能是对人类“直觉”的技术实现,以前人类对“直觉”感到很神奇很玄很神秘不可思议,现在人类用软件模拟出来了,进行大量的数据运算处理就能实现,预计以后人类可以用软件模拟更多的人脑功能,如想象力、创造力、预测能力等。

目前计算机的计算速度越来越快,计算的任务由计算机承担,但是算法和数据结构设计只能由人来做,算法和数据结构设计是软件编程的核心。
“阿尔法狗”2.0采用了更高效的算法,高效的搜索策略和准确的估值函数,可以在一台计算机上运行,运算量只有上一代AlphaGo1.0的十分之一。
但水平更高,可以让“阿尔法狗”1.0三个子,旧版软件成为新版软件的陪练。
“阿尔法狗”1.0采用分布式计算,使用了由1920个CPU和280个GPU组成的分布式计算模块。用了50个TPU(谷歌专为加速深层神经网络运算能力而研发的芯片)。
“阿尔法狗”2.0在一台单机上运行的,物理服务器上载有4个TPU在运作。
席尔瓦说道:“AlphaGo大师版能如此高效运算的最主要原因是,我们使用了最好、最可用的数据来训练它。我们所说的最好的数据不是来自于人,而是来自于AlphaGo自己。AlphaGo现在等于说是自学成才。我们让它自己当自己的老师,而这一代的AlphaGo也会成为下一代AlphaGo的老师。”
“阿尔法狗”的升级之路,也是人工智能的升级之路,也是电脑的升级之路。
好的算法加上大量的数据训练。可以单独进化,初期模仿人类,后期独立创造,独立进化,最终人类棋手需要向“阿尔法狗”学习。
电脑的发展也一样,初期模仿人脑,后期可以独立进化,人脑需要反过来学习电脑。

“最初的AlphaGo主要依靠监督学习,即学习对象几乎全部来自人类棋手,而新版的AlphaGo则强化了增强学习,主要对机器自我对弈产生的棋局进行学习。”
“DeepMind资深研究员David Silver指出,AlphaGo一开始的设计就是跟人类对弈来学习的,必须要跟世界上顶尖的棋手对弈才能改善,在这个版本当中,AlphaGo Master现在已经是自己的导师,透过对战的过程中不断自我学习、探索,所以对人类数据的依赖性越来越小,让他能够继续超越围棋。”
新版“阿尔法狗”正式摒弃了人类棋谱,只靠计算机自身深度学习的方式成长——即探索“深度学习”方式的极限,臻至“围棋之神”的境界,下出真正属于“人工智能”的围棋。
“监督学习”就是学习他人的经验智慧,“增强学习”指自我学习,其实就是创造。
先学习、后创造,学习是创造的基础,创造是学习的高级阶段,是必然的。
AlphaGo的水平达到一定高度,是无法从比它水平低的人类棋手中获得更多经验的,只能自我对弈。
一个人的发展也类似,初期跟他人学、模仿,后期主要是自我学习、自我探索、自我突破、自我创造,对他人的依赖必须越来越小。
自我学习、探索、突破、创造就是独立思考。只有通过独立思考才能探索前人从未探索的领域,通过个人的自我超越来实现人类整体的自我超越。

“阿尔法狗”可以使用增强学习,通过自我对弈提高围棋水平,人类为什么不行?
没有棋手能通过自我对弈提高围棋水平,通常都是找高手下棋才能提高围棋水平。
是因为人脑无法克服思维惯性、思维定式,还是缺乏足够的创造力?
每个人类棋手都有自己的棋风。
“AlphaGo1.0的时候(去年3月跟李世石对战的时候),它的棋风概括起来就是擅长记住棋谱+增强学习+计算能力,身上还能看到人类棋风的影子”
“而AlphaGo2.0脱离了机器对人模仿,走棋风格也将完全脱离人的定式。”
AlphaGo2.0变得没有棋风,经常不按教科书中的棋谱定式走棋,走出让人意想不到的棋。也证明了以前围棋教科书中的定式不是最佳策略,或者在特定的局部的情况下才是最佳策略,人类很容易犯教条主义的错误。
每个人由于有一些心理因素,总想战胜他人,总是想赢怕输的,自己是没有兴趣与自己下棋的。缺乏兴趣,也就缺乏动力。
通常都是预估对手会怎么走,从多种可能性中找一种最好的策略。自己与自己下棋,是无法切换角色的。
每次都要选择对自己最有利的策略,当变成对方时,又要重新考虑对对方最有利的策略。这样的思维转换是无法实现的,对于人来说是自相矛盾的,无法实现,人脑还做不到这么灵活。
也可能是人类现有的棋手还没有摸索出围棋的规律,没有掌握围棋的真谛,没有使用正确的思维方式。
如果人类棋手要学习AlphaGo2.0那样没有棋风,除非每走一步,头脑必须清空,克服思维惯性,把以前想的策略全部忘掉,一切从新开始,全部重新分析判断,再搜索最优策略,这需要更高的运算速度和准确的判断为基础。
人生也像下一盘棋,每一步都需要全盘考虑,寻找最佳方案,寻求最优化的发展道路。

在围棋这样的博弈游戏中采用增强学习的方法效果显著,在其它其它领域,增强学习的方法也是值得借鉴的。软件养生学的发展也需要借鉴“增强学习”的方法。
软件养生学发展初期是学习模仿阶段,学习已有的“软件”和“养生”领域的知识、方法等经验,发挥电脑和人脑各自的优势,然后慢慢把两者融合。
软件养生学发展后期是高级阶段,即创造阶段,需要把人脑电脑高度融合,创造出有别于传统软件、传统养生的方法技术理论实践体系。
已证明软件不仅仅是工具,不仅仅是术、法、器,也是道、理、学。既是形而下,也是形而上。软件是一个道术融合的统一体。软件是破解任何未解之谜的最强力最高效的工具。
软件养生学的创造阶段需要寻求高效简单的训练方法,同时提高软件水平和养生水平。
养生押韵诗词训练就是这样一种方法。
左右脑需要综合运用,要涉及人脑养生、又要涉及电脑软件程序设计,又要尽量简单易学易行、贴近日常生活。训练的成果即诗词作品对自己和他人也有帮助,丰富人类的诗词文化库。

人比机器更智慧,下少量的棋就能提高经验值,最顶级的九段棋手一生最多也只能下一万盘棋左右。
机器虽然没有人智慧,但不辞辛劳,勤能补拙,可以通过下百万上千万的棋来提高经验值,可以很快超越人类棋手,成为人类棋手的老师。
经验多的人或机器就可以做老师,包括“棋圣”聂卫平在内的众多围棋职业高手都尊称“阿尔法狗”为“阿老师”。

下围棋多水平高的人做围棋老师,作诗多水平高的人做诗词老师,写作多水平高的人做作文老师,编软件多水平高的人做软件老师,创作音乐多水平高的人做音乐老师,玩游戏多水平高的人做游戏老师,养生修炼多水平高的人做养生老师......
每个人都有一颗独一无二的大脑,出生时都什么都不懂。除了极少数有严重先天缺陷的人以外,绝大多数人的智力水平相差不大,差别可以忽略不计。每个人都有相同的时间,只要在某一方面用上足够的时间,都可能在某一方面成为老师。每个人都有不同的爱好,在各自爱好的领域都会自觉自愿地投入大量的时间。除了投入时间以外,还需有明确的目标,并掌握一定的方法。
未来很可能是一个人人皆为师的时代。每个人除了自己当老师还远远不够,关键是能否开发出一个“阿老师”?

可以预见的是,如果多向“阿老师”学习,人类棋手必然进步神速,输得越多,总结经验教训越多,向“阿老师”学习高超的招数越多,人类的思维模式越来越接近“阿老师”,棋力可以无限接近“阿老师”,一定比没有得到“阿老师”真传的人类棋手水平高。由“阿尔法狗”围棋大师训练出来的人类棋手的水平一定比由人类训练出来的人类棋手水平高、进步快。
结果就是,谁能用到“阿老师”这样的工具软件,谁的能力就强。
“阿老师”就是机器人老师,比人类老师高明得多、强大得多,任何一个人类老师,只能服务很小一部分人,而机器人老师可以全天24小时同时服务全人类。
一个不会下围棋的小孩如果能获得“阿老师”这样的工具软件,通过大量的训练之后,就可以直接打败职业围棋九段高手,不再需要人类的围棋老师?不再需要目前围棋的各种理论?
人脑通过大量的实践自然就能总结出规律?

“阿老师”这样的围棋工具软件可以取代所有的人类围棋老师,对围棋的贡献最大。
同理可证,在人类其它领域,谁能设计出更好的算法,开发出高效的工具软件,创造更多的“阿老师”,取代越来越多的人类老师,谁对人类社会的贡献就越大。
“阿老师”是由围棋高手和程序设计开发者共同协作开发出来的,是人类集体智慧的成果。
未来人类老师这样职业很可能会消失?
人类的所有老师都可以转行做机器人老师的软件设计师、软件程序员、软件测试员、高级陪练助手等工作。
所有的人都为机器人软件服务,机器人软件为全人类服务,人类所有的老师从以前的直接为人类服务转变为间接为人类服务。

每个人只需要为程序设计开发者提供自己的经验,或者自己成为程序设计开发者。
求人不如求己,如果每个人自己成为程序设计开发者,不依赖于他人编程,想编什么软件就能编什么软件才是最自由的。

编程能力是一个人最重要的能力。未来谁会编程谁就更容易在某个领域取得突破。
计算机的硬件速度越来越快,成本越来越低,公共的、免费的、或低价计算或服务资源(例如目前的一些云计算、云服务)越来越多。
在互联网面前硬件资源对于每个人都是平等的,唯一不同的就是每个人的学习能力、编程能力。
会学习、会编程的人就会充分利用这些资源,设计开发更多的软件,获得更多的技能,创造更多的物质财富和精神财富。不会编程的人,不会利用这些资源,必然落后。

未来人工智能将广泛用于人类的各个领域,全部体力劳动和越来越多的脑力劳动将由机器取代,很多职业会消失,同时会产生更多新的职业,很多人需要选择新的行业。
人工智能的发展需要通过大量的编程才能实现,程序设计和开发必然成为最热门的行业。
程序设计开发者会越来越多,整个社会由硬件普及发展到软件普及,直至发展到全民编程。
编程能力是人脑最具创造力的能力,人工智能要想进化到能自主编程,估计还需要很长时间。在人类人工智能发展过程中,需要大量的程序设计开发人员。
未来只存在两种人,一种人不会编程,另一种人会编程。不会编程的人,大脑进化缓慢,会编程的人进化快,对社会的贡献也更大。

“李开复:AlphaGo还是弱人工智能”。
“弱人工智能:专注于且只能解决特定领域问题的人工智能。”
“强人工智能:能够胜任人类大部分的工作,在大多数领域甚至达到取代人类50%以上的工作。”
“超人工智能:比世界上最聪明、最有天赋的人类还聪明的人工智能系统。”
“弱人工智能的发展还有很长一段路要走,人类离超人工智能的威胁还相当遥远。”
但是如果在全民中普及软件设计开发技术,就可以极大地加快人工智能的发展过程,很快就可以从“弱人工智能”发展到“强人工智能”,甚至可以很快实现“超人工智能”。
设想,如果每个人都掌握软件设计开发技术,都能在各自的特定领域开发出“弱人工智能”的“阿老师”,所有的老师都变成机器人老师,人人都可以获得廉价或免费的教学资源,教学效率得到空前的提高,每个人的智慧必然可以得到空前的提高,人类整体智慧也可以得到空前的提高,社会生产力也可以得到空前的提高。普及软件设计开发技术就是一条捷径,是最有意义的事情。

杰米斯·哈萨比斯,DeepMind创始人,AlphaGo(阿尔法狗)之父生于英国伦敦,母亲是新加坡华人,父亲来自希腊的塞浦路斯。17岁考入剑桥,学习计算机专业,2005年进入伦敦大学学院,攻读神经科学博士学位。可见哈萨比斯既精通计算机科学,又精通人脑神经科学,才设计出这么好的软件。
感谢“阿老师”之父哈萨比斯,向人类展示证明了软件的威力,超越了人类围棋棋手,做到了单凭一个人的人脑无法做到的事情。
人类中存在很多天才,有很多奇思妙想,而软件就是用来实现这些奇思妙想的最好的工具方法。
“阿老师”软件颠覆了围棋世界,四千多年前中国人尧发明了围棋,可是一直没有探索到围棋的真谛。直到人类发明计算机一百多年后的今天,终于依靠计算机软件摸到或者完全掌握了围棋的真谛。
更多的“阿老师”软件必将颠覆人类的其它世界,生命科学领域、养生修炼领域、社会科学领域也不例外。生命科学的突破、养生修炼技术的提高和普及、社会进步大同世界的早日实现等,也将依靠计算机软件的发展。软件对世界的影响是全方位的,软件必将帮助人类加速进化,软件必将颠覆整个人类世界。


【签名】 提倡创造性思维。软件养生学创始人。科学普及工作者。计算机应用技术专业博士毕业。多年计算机软件开发和养生修炼经验。完美实用主义者。外求法与内求法相互结合。爱好广泛,酷爱哲学、计算机学、养生学、游戏学等。