2016年,AlphaGo 4∶1击败人类围棋冠军,它是否会进化到陪伴人类下棋的BetaGo(陪Ta狗)?
| 作者:杨小康
1956年夏,麦卡锡(J. McCarthy)、明斯基(M. L. Minsky)等正式提出人工智能(artificial intelligence,AI)的概念,标志着人工智能学科诞生。在人工智能发展60周年的2016年,谷歌DeepMind AlphaGo战胜李世石,树立了人工智能新的里程碑。
从AlphaGo看人工智能现状
AlphaGo的人工智能原理
围棋是最复杂的棋类游戏,人类高手下围棋主要靠宏观的直觉,加上局部的计算。AlphaGo凭借两招出奇制胜:深度卷积网络,模仿高手,寻找好的落点;深度强化学习,形成左右互搏,自我进化。
AlphaGo的第一招:模仿高手,学习高手的棋形。要模仿高手棋形,AlphaGo需要一个分类器来判断棋形是否与高手的棋形相像。围棋盘可以看成是19×19的图像,虽然这个图像很小,但约有250 150种变化。将这些变化分成高手棋形、非高手棋形,是一个挺难的机器学习问题,主要难在高手棋形的特征不好定义、不易提取。在人脸识别、车牌识别中,可以定义颜色、边缘、关键点等特征,显然围棋棋形的特征不能使用同样的方法。
AlphaGo使用了最新图像分类器——深度卷积神经网络(deep convolutional neural network,DCNN),可以自动学习图像中好的特征。不同于传统的人工神经网络,该网络的层数特别多,学习和分类的能力非常强。神经网络早在1943年就已提出,在1950年代末和1980年代曾兴起过两波研究热潮。以前的人工神经网络层数很浅,只能解决一些简单识别问题。2000年前后,欣顿(G. Hinton)等提出一套预训练后向传播的方法,解决了深度学习问题 [1]。DCNN是专门针对图像识别的深度学习方法,对局部图像进行卷积计算,效率很高。
深度学习能够发挥巨大威力的前提是,必须要有大量的数据才能训练深度结构。深度学习会涉及上百万、甚至上亿的参数,如果数据不够,很容易过拟合、性能降低。此外,进行这样大规模的训练,需要超强的计算能力。据说,AlphaGo存有15万职业棋手、百万业余高手的棋谱,训练的时候会用到1202个中央处理单元(central processing unit,CPU)和176个图形处理单元(graphics processing unit,GPU)。
AlphaGo的第二招:自我学习,自我进化。 模仿高手还不足以超越高手。为超越顶尖高手,AlphaGo用了一个自我学习的机制,就像金庸小说《射雕英雄传》中的老顽童周伯通,左右互搏。人类高手通过自我复盘、摆棋谱来提高棋艺,但是人类高手复盘慢,一次复盘往往需要数小时甚至数天,其间棋手还需要吃饭、休息。而AlphaGo只要有电就可以一直左右“互搏”下去,其复盘速度极快,每分钟就可以研究上万盘棋,这样的特性使得AlphaGo有可能在学习速度上超越人类高手。
为了达到左右互搏的效果,AlphaGo采用了一个名为深度强化学习的技术。强化学习很符合智能体(agent)的学习规律,类似孩子在不断跌倒中自我强化学会走路,猴子在胡萝卜加大棒下自我强化学会表演。强化学习有两个特点,一是智能体通过环境交互学习,二是训练标注稀少,且通常有一定的延时。强化学习主要通过感知、行动、奖赏三个环节构成一个状态转移空间,学习过程可以用马尔科夫决策过程来表示。
之前,强化学习的算法训练只能解决很小规模的状态转移空间。围棋是超大转移空间的问题,同时也是个带有超长延时训练标注的问题。一开始的棋难以量化好坏,双方要下多步后才能够数出各自大概的目数,从而判定输赢。AlphaGo将围棋这一特征视为深度强化学习问题,这个问题恰恰可以用深度的递归神经网络(diagonal recurrent neural network,DRNN)解决。DRNN的训练和DCNN没有太大区别。在左右互搏中,AlphaGo局部会采用一种名为蒙特卡洛搜索树的随机策略进行搜索,令整个系统能够自我进化。
AlphaGo是最新深度学习方法、棋谱大数据以及最新超算体系的总和,并按现代科学技术的指数式发展继续进化,没有任何情绪波动。尽管在此次人机大战中,人类个体告负,但AlphaGo却是人类挑战自我的里程碑!
未来人工智能感知的思考
未来人工智能的发展愿景
“类人服务、超人感知”愿景
在国内外专家看来,未来人工智能有很多、很高远的愿景。笔者看来,在人工智能的愿景中,至少应该包括“类人服务、超人感知”的愿景,即以类人的方式服务人类自身,以超人的方式感知外部世界。类人服务要求具备类人智能,具体而言,从人类的视角看,未来人工智能理应在感官和思维上像人;从机器的视角看,未来人工智能应该能理解人的行为和情绪。
传统社会是一个二元空间,人类社会和物理空间形成互训关系。而在信息社会,人、机、物三者相互融合,形成一个三元空间。未来,人工智能可进行人、机、物信息的整合,以超越人类的精度和时空尺度,感知三元空间的信息关联性。
交叉学科的研究,特别是脑科学的研究 [4],将进一步夯实机器学习的理论基础,三元空间的大数据和超级计算能力将进一步提高机器学习的工程能力。机器学习、大数据、超级计算机三者将共同实现未来人工智能超人感知、类人服务的愿景。
类人智能
类人智能是指将类人知觉和类脑思维整合。如果机器人具备逼近人类的交互能力,那么击败人类的AlphaGo将极有可能进化到陪伴人类下围棋的BetaGo(俗称为“陪Ta狗”)。
可以从知觉和思维两个层面来理解类人智能。在知觉层面,随着低成本、低功耗传感器的发展,未来人工智能将通过视、听、味、触等方式感知和认知现实世界;在思维层面,未来人工智能则需要实现类脑计算。从长远来看,研究类脑计算是通往强人工智能的有效方法 [2]。传统的计算机相当于左脑,擅长逻辑思维,处理数字;神经元芯片相当于右脑,擅长形象思维,处理图像。目前,IBM等公司正着手将两者整合,以期实现全脑的类脑计算。
三元空间协同感知
科学家正在研究人、机、物的三元空间协同感知。从侧重于物理空间的感知层面看,突破人类肉眼感知的局限性是人工智能的传统强项,可见光谱、红外光谱、太赫兹、核磁共振等可实现全谱感知,相当于赋予了人类天眼或慧眼。
从人类社会层面看,群体智能新技术和社会计算新学科不断涌现。通过利用不同网络的大数据,可以解决传统社会学调查方法数据稀少的问题,能更好、更快地分析人群、组织和社会的行为。
立足于信息空间的层面,未来学家认为互联网正在向着与人类大脑高度相似的方向进化,它将具备自己的视觉、听觉、触觉、运动神经系统,也会拥有自己的记忆神经系统、中枢神经系统、自主神经系统。通过借鉴研究人类智力的方法,对互联网大脑和因为互联网而崛起的人工智能的智力问题进行深入研究,最终形成互联网、人工智能和人类大脑的联合智商。
我国的人工智能战略
人工智能已经上升为我国的国家战略,国家“科技创新2030 重大项目”将新增人工智能2.0。潘云鹤院士于2016 年12 月在中国工程院院刊Engineering(主刊)上,提出了人工智能2.0 的核心理念 [3]。2017年1 月,中国工程院院刊信息与电子工程学部分刊出版了“人工智能2.0”(artificial intelligence 2.0)专题 [4],潘云鹤、李未、高文、郑南宁、吴澄、李伯虎、陈纯等院士以及多位专家学者对人工智能2.0 中所涉及的大数据智能、群体智能、跨媒体智能、混合增强智能和自主智能等内容做了深刻阐述。
AI 有三个关键部分构成,机器学习是AI 的大脑,超级计算机是AI 的躯体,大数据是AI 成长的养分。据统计,全球43% 的机器学习相关论文出自中国学者之手。目前,我国已有众多的AI 人才,形成了AI 垂直产业应用的人才基础。近年来,我国的超级计算机发展迅猛,“神威·太湖之光”“天河二号” 超级计算机先后登顶TOP500 排行榜,这给人工智能的发展提供了坚实的硬件基础。在大数据方面,相对欧美日等国,我国不仅拥有众多的“冷数据”(包括人口、地理等静态数据),而且拥有更多的“热数据”(比如交易、诊疗等动态数据),大数据优势将有力推动我国的AI 研究形成特色,实现弯道超车。
未来,人工智能无疑会深刻改变人类生活。尽管坚信人类能够与人工智能包容发展,但仍需要注意人工智能将引起的就业结构改变和其冲击伦理关系所带来的诸多挑战。
[ 本文相关工作得到国家重点研发计划课题(2016YFB1001003)、国家重大科研仪器研制项目(NSFC61527804)等资助。]
杨小康:教授,认知计算和计算健康研究中心副主任,上海交通大学电子信息与电气工程学院,上海 200240。
Yang Xiaokang:Professor, Vice Director of the Center for Cognitive Machines and Computational Health, School of Electronic Information and Electrical Engineering, Shanghai Jiao Tong University, Shanghai 200240.
-
Hinton G, LeCun Y, Bengio Y. Deep learning. Nature, 2015, 521(7553): 436 – 444.
-
蒲慕明, 徐波, 谭铁牛. 脑科学与类脑研究概述. 中国科学院院刊, 2016: 31(7): 725-736.
-
Pan Y H. Heading toward artificial intelligence 2.0. Engineering , 2016: 409 – 413.
-
Pan Y H, Li W, Gao W, et al. Special issue on artificial intelligence 2.0. Frontiers of Information Technology & Electronic Engineering, 2017: 1-152.
关键词: 人工智能 机器学习 深度学习 神经网络 ■
本文刊载于《科学》杂志2017年第3期。
《科学》杂志于1915年1月在上海问世,
早年由任鸿隽,赵元任,胡明复等学者编辑写作,
是我国历史最长的综合性科学刊物。
杂志定位为高级科普期刊,致力于科学知识、理念和科学精神的传播,科学与人文互动,历史和前沿并举,为提升我国全民科学素质和建设创新型国家服务。杂志现任主编为中国科学院院长白春礼院士,主办单位为上海科学技术出版社。
原文链接:http://www.360doc.com/content/17/0604/22/68780_660032581.shtml