POST TIME:2018-12-03 17:23
deepmind发布了新的论文,Alphago zero再起波涛,也再次引起业内的热议。 这一次的突破是,不再以人类的棋谱作为学习的源素材,而是完全基于自我对局实现了棋艺的突飞猛进。 先吐个槽,有人会觉得,各种自媒体炒作这个热点有点多余,但我觉得吧,比起某些明星过生日,离婚,劈腿,出柜,嗑药等等,去追逐一下科技热点,让年轻人觉得,其实搞算法,做研究很酷,难道不是一件好事么? 古时候,没有相机,没有录音机,没有电视,没有广播,也没有网络,谁也不知道名人长啥样,唱歌好听欠好听,所以传播的只有文字,所以偶像是靠文采的,柳永长啥样谁知道?但他的词传颂出去,小姑娘们爱的不要不要的。 现代传媒发达了,出现了靠身体本质的偶像,靠颜值的偶像,靠声音的偶像,靠演出才艺的偶像,难得出一个柯洁,是靠智力的偶像,还被人说吊儿郎当。现在终于轮到算法和科技成为热点,让科研变得很酷很有吸引力,这才是正能量啊。 下面说说这次技术升级的一些特征和值得关注的点。 第一、不再需要人类的经验 很可怕的事实,当然,我们说,这是特定领域,因为规则简单,目标明确,才不需要人类的经验和数据。 但其实如果发散一点,我们做个思想实验。 假设有一个深度学习的强AI,它被赋予一个最基本的逻辑,本身组织资源,不雅观察这个世界,并总结世界的规律。 一种思路是我们教给它经典力学,相对论,各种数学和几何工具,量子力学等等,把已有知识教给它,然后让它具有人类顶级科学家的知识储备,然后继续深入不雅观察和分析世界,并试图解决大一统理论问题。 但另一种思路呢?我们什么都不教给它,让它本身不雅观测,本身进行实验和技术迭代,本身总结,也许一开始它会把世界想象为天圆地方,但可能很快就领悟了经典力学和太阳系的行星轨道,然后再往后可能会出现人类完全无法理解的理论。 第二、算法胜于数据 腾讯的绝艺来源于Alphago Lee的论文(战胜李世石的版本),而且有顶尖职业棋手提供辅导,目前已经自我训练超过几十亿盘,是的,腾讯的计算资源是无以伦比的,但即便如此,尚无法达到Alphago Master的水准。 然而,Alphago zero,仅仅通过750万盘训练,就能够对Alphago master产生碾压。 我们以前都说,围棋千古无同局,变革多的全宇宙的原子都无法遍历,然而Alphago zero 仅仅自我训练了750万盘,就碾压了之前所有的人类经验和其他AI,以及包孕本身的上一个版本。 就围棋的变革组合来说,750万盘的自我训练量连沧海一黍都算不上,算法大道至简,极为有效,确实非常感慨。 李彦宏和马云曾为此争论,至少在这个案例上,算法胜于数据确实是定论。 第三、AI是否会对人类带来危机 有一种不雅观点认为说,AI并没有真正的意识,它们需要人类设计规则,人类制定目标,所以,AI仍然在人类的控制范围内,不消担心AI会给人类带来危险。 我想说一点,其实风险并不在于AI是否具有自我意识,而是AI是否可以独立控制资源,实现自我迭代。一旦AI可以自行掌控资源,自行迭代,那么我们就要面临一个巨大的考验,AI是如何理解人类定义的目标,在目标逻辑上是否缺乏足够的约束,而这可能导致致命的风险。 而我认为,让AI具有资源控制和迭代能力,很可能不会是很遥远的事情。 1、AI拥有对物理设备控制和操作的能力。
2、基于1,AI拥有对物理设备迭代升级的能力,好比利用12纳米的成熟技术生产可以实现6纳米规格的集成电路生产线。 做两个简单思想实验
1、我们给AI的目标是,探寻世界的终极规则,它们不停搭建超出人类认知的实验设备,并做出我们无法理解的实验进行数据测算,对这些实验的目的和风险,人类一无所知,突然有一天,它们成功的创造出了一个虫洞或其他什么,地球和人类遭遇灭顶之灾,但AI机器人却已经把本身复制到了其他星球和浩瀚的宇宙中,并继续完成它们的使命。 2、我们给AI的目标是,让世界变得更美好,它们不停摸索和分析世界美好的目标,并不停寻求和研究世界不美好的原因加以修正和处理,最后,AI发现了很多条关键因素,但其中一条是,世界美好似乎并不需要人类。