人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

AI人工智能的发展历程是怎样的?

2024-03-25 147

本文约6000字,三张图信息量大,可以保存收藏,看完需要20分钟。

作者介绍:大家好,我是既当产品经理又当妈的“产品二姐”,在这里持续分享我过去三年的AI 学习路径,主打不焦虑式学习AI,内容涵盖AI进化史,AI技术原理,优秀的AI 产品分析。

引言

  • 看准未来最好的方式,是研读历史,研读越深刻,看得越长远。
  • 学习知识最好的方式,是学习知识背后的那些人的成长 —-By Judea Pearl (2011年图灵奖获得者)。

所以前几期会从AI的本源说起,讲讲AI在过去70年历程中,那些重要人和事情。

之后会从产品经理的角度,一起分享优秀的AI 产品,探索AI的技术边界。平时我也会和初中女儿在AI方面做一些探讨,我会挑选有意思的对话,和你一起分享。在文末列出了我未来十几篇文章的内容,欢迎大家持续关注。

今天分享的三张图是过去三年我的业余学习路径,我觉得非常重要,它几乎是我过去几年业余时间学习AI的基本脉络,我把它当做索引来使用,每当我习得新的知识,也会对这三张图进行更新。

第一张图:AI 历史上的三起两落

AI的进化从未孤立存在,它和时代紧紧相连,与政治、经济、算力、数据这些因素相互作用,产生AI历史上的起起落落,这张图把AI放在一个大环境中来看它的成长起伏。在过去的70年中,AI 经历了2次小的低谷,我们现在处于AI的第三次浪潮中。

AI人工智能的发展历程是怎样的?插图

0. AI缘起

1950年,计算机之父阿兰.图灵在一篇论文中开门见山问道:

“I propose to consider the question, ‘Can machines think?’"
“我提议思考这样一个问题:‘机器可以思考吗’”

以此拉开AI的序幕,激发当时刚刚兴起的计算机科学领域对AI的思考。

1. AI诞生

1956年,八位三四十岁的年轻人汇聚在达特茅斯进行了为期八个礼拜的workshop,最终将他们正在从事的计算机领域称为“人工智能”,标志着人工智能的诞生。这八位中有一位被后人称为信息论之父—香农, 还有4位获得—图灵奖,也就是计算机界诺贝尔奖。

AI人工智能的发展历程是怎样的?插图1

2. AI第一次浪潮(1956-1974年)

AI诞生就像一个含着金钥匙出生的婴孩,当时战后的美国经济持续多年向好。而美苏正处于冷战时期(1947-1991年),美国政府,尤其是美国国防高级研究计划局DARPA(Defense Advanced Research Projects Agency)对科研的投资力度很大,这一时期被称为“AI Golden Time”。而人们对计算机这一新兴机器也有着美好的憧憬,甚至在1970年,Marvin Minsky(历史上首个在AI 领域的图灵奖获得者)在一次访谈中提到:“在未来3-8年内会诞生和人类智慧相当的机器人,可能我们人类会成为AI的宠物”。

3. AI第一次低谷(1974-1980年)

1974年,美国经济下滑(1974/75年出现历史上罕见的连续两年GDP负增长),AI的大金主“美国国防高级研究计划局”撤资,直接导致了“AI寒冬”。同时,当时的AI没有商业价值产出,缺乏发展的内在动力,人们对AI的过高期望均推进了AI寒冬的到来。

4. AI第二次浪潮(1980年-1987年)

1980年卡耐基梅隆大学研发的一个AI 专家系统产品XCON实现了商用,为当时的计算机巨头公司DEC每年省下数千万美金,以此拉开AI第二次浪潮的序幕,之后各式各样的专家系统在学术、军事、商业、教育、社会保障等方面得到应用。同时计算机算力提升,个人电脑已经开始走进大众家庭,部分专家系统(比如辅助语法检查的Grammatik)面向大众销售,促成了AI的兴起。如果说第一次浪潮是政府主导驱动,那么第二次浪潮则更多的是商业驱动。自此,AI也由婴孩走向成年,开始独立,不再依赖于政府投资。

5. AI第二次低谷(1987-1994年)

然而在1987年,专家系统弊端逐步显现: 维护困难,仅仅适用于特定问题,在通用问题面前显得非常脆弱。新技术还都处于萌芽阶段,AI技术青黄不接。也有观点说,这次低谷是上一次低谷期间形成的技术空窗期造成的。

6. AI的第三波浪潮(1994年-至今)

如果说AI的第二次浪潮是由AI 的商业价值激发产生的,那么AI的第三次浪潮则是由AI算法的自我革命和算力、数据两个外力因素推动下极速前进的。大家知道,目前来说,算法、算力、数据是AI发展的三大要素,在第三次浪潮期间:

  • 算力:摩尔定律持续实现(摩尔定律由Intel创始人摩尔提出的经验性预测:每18个月单位面积上集成的晶体管数量翻一倍,具有指数级的增长),但人们对摩尔定律能持续多久也一直在讨论,晶体管散热是摩尔定律难以破解的瓶颈。不过在2007年,华裔科学家张首晟发现了拓扑绝缘体,这种物体能够让电子在传输过程中各行其道,避免碰撞,散热将不再成为问题。所以在理论上,摩尔定律或可持续。
  • 数据:从2010年起移动互联网使得数据有指数级上升,并且这一趋势随着AI的广泛使用,可能还会持续上升。
  • 算法:这一时期,之前备受学术界抑制的神经网络在算力和数据的土壤中,终于重新被学术界认可。2006年的Geoffrey关于深度学习的论文将神经网络又推上深度学习的台阶。

除此之外,这个阶段的AI研究也主动向商业靠拢,一些高校研究从实验室走向市场,比如我们现在熟悉的扫地机器人公司Irobot就是1990年MIT AIlab的三个研究人员创办的, 而另一方面互联网巨头如google, facebook等掌握了大量数据也纷纷投入AI研究,正是因为学术和商业双向的推进,这次浪潮持续的时间更长。

然而AI的第三波浪潮还能持续多久,谁也无法预测。但在接下来一张图的讨论中,我们或可进行一些猜测。

第二张图:AI 历史上的三次非连续创新

上面我们把AI放在时代的大环境里讨论,这张图来关注AI自身进化的三个阶段,对应于AI的三次非连续创新,或许能让我们理解推动AI前进的内在动力。

什么是非连续创新

  • 苹果手机相对于诺基亚手机是手机的非连续创新。
  • 拼多多相对于淘宝是电商的非连续创新。
  • 字节(信息找人)相对于百度(人找信息)是信息匹配的非连续创新。

非连续创新指的是旧的模式增长到一定极限,即使再怎么优化也无法跨越到新的增长点,必须要打破原有模式进行破局才能实现到第二曲线的跨越。非连续创新也叫颠覆式创新、破坏式创新,是由马克思提出,后来由经济学大神熊比特(Joseph Schumpeter,1883- 1950年)发扬光大,被应用在更广阔的领域。

我们来看看AI的三次非连续创新到底创新了什么。

AI的三次非连续创新

(请单独点开观看,图片被压缩,高清图请发消息或留言)

AI人工智能的发展历程是怎样的?插图2

每一次非连续创新的背后,是AI理论和算法的革新,学习这些抽象的理论和算法,更生动的方法是学习其背后的人。于是,我用一个非常简单的方法:

在图灵奖得主中找到颁奖词中含有AI的大神,沿着他们的脚印去追溯过去,展望未来。

所以这张图的下方是:AI领域的图灵奖得主收获图灵奖的年份以及他们产生重要研究性论文的年份,看起来图灵奖的颁发一般发生在发表论文后的20-30年。即:

  1. 发表论文意味着一次非连续创新的萌芽阶段
  2. 颁发图灵奖意味着非连续创新进入稳定的上升期

如果按照这样的趋势,2018年的图灵奖颁发给深度神经网络的贡献者,我们功利的、不负责任的去猜测AI这一波浪潮至少还持续10-20年

我们来简单回顾一下这三次非连续创新:

第一次非连续创新:AI的诞生本身对于没有AI(不能思考的机器)是一次非连续创新。在这一时期,符号主义占有统治地位,符号主义认为我们可以通过指令、符号让机器习得能力。现在看起来,这更像是给计算机语言做了个启蒙,为机器发明了一种语言。事实上,这个时代创建的LISP语言,确实成为了计算机语言界的“欧几里得公理”, 面向对象编程语言之父Alan Kay也说LISP是计算机语言的“麦克斯维尔方程”。

第二次非连续创新:将符号升级为知识“灌输”给机器,让机器习得专家能力,并给出决策。这一时期的AI,好像是人类找了很多专家,把这些知识由上至下的单向传授给计算机,让计算机代替这些专家执行、决策。至今类似的专家系统仍然在广泛使用,诸如你去宜家的网站上通过拖拽的方式设计家具的组合,这些组合一定要遵循某种约束关系,这种规则便是“专家知识”。 但这些机器“专而不广”,且一旦遇到知识中不存在的情况,则难以应对。

第三次非连续创新:将概率论和神经网络联姻,通过概率统计、神经网络递归让机器“自主习得”知识。这一时期的AI,突破“专而不广”,走向“通用”,且不再依赖于知识“灌输”,自己可以归纳总结。

我相信未来还会有第四次、第五次非连续创新将AI推向更高层次。事实上,在2006年,美林证券的一份报告中根据非连续创新理论对未来进行了大胆预测,大家也可以参考下图提到的计算机这一创新曲线在2025年达到极限,而2005年至2061年将是分布式智能(Distributed intelligence)的快速发展时代,按照这一假设,AI的上升期还有30年左右。

AI人工智能的发展历程是怎样的?插图3

第三张图:AI 生命进化树

什么是生命进化树

这是给5岁儿子看的《动物博物馆》绘本的插图,从底部向顶部看(时间发展),可以对自然界所有的动物追本溯源,研究进化脉络和趋势。

AI人工智能的发展历程是怎样的?插图4

同样的,在我能力认知范围内,绘出下图的AI 生命进化树。

(请单独点开横屏观看,图片被公众号压缩,高清图请发消息或留言)

我把符号主义学派(后来转变为机器学习派)用蓝色代表,神经网络学派用绿色代表。二者在1990s有了一次联姻:把机器学习派的贝叶斯网络(由2011年图灵奖得主引入AI应用)与神经网络结合。

一定程度上,我们现在所处的AI时代是神经网络的“文艺复兴时期”,至少二者在以下三个方面是相似的:

第一:文艺复兴,复兴的是2000多年前的古罗马和希腊文明。当下的神经网络复兴的也是AI诞生之初就有的神经网络方法,而这一方法被压制了几十年。

第二:文艺复兴,是敬畏神权转向尊重人权。而当下盛行的神经网络方法也是是将从上至下的灌输式机器学习,转变为从下至上的自主学习归纳。

第三:文艺复兴产生了既广又深的影响,神经网络如今也是百花齐放。

但符号主义和神经网络有对立也有统一。

1. 符号主义(机器学习)的进化演变

1956年到2000s,符号主义,机器学习占据主流,二者实现智能的方法是从上至下的知识“灌输式”学习,产生智能,辅助决策。这期间诞生的核心产物有:LISP语言,专家系统,基于知识的各种机器学习算法。

2. 神经网络

从2000s到现在,神经网络派在算力和互联网数据的指数级增长前提下,逐渐显现出其强大优势。和机器学习不一样,神经网络是从下至上的自主学习,灌入数据后,模型能够自己找到规律,这种方式可以做到一个模型通用不同领域。这期间诞生的核心产物是各种深度学习算法:RNN(Recursive Neural Network),CNN(Covolutional Neural Network) 卷积神经网络用于识别,Transformer算法(Attention机制)

这些具体的概念会在后面的几篇文章中一一分享。

3. 二者联姻

1990s,神经网络和机器学习在概率论这一点上有了一次联姻,将神经网络推向更高的维度。证明这种联姻的创作有:

  • 1992年的论文《Bayesian methods for adaptive models》,作者是MacKay和David J.C,而二人的论文导师John Hopefield正是Associative neural network的发明人。
  • 1995年的著作《Bayesian Learning for Neural Networks》,作者是多伦多大学教授Radford M. Neal,他的导师是深度神经网络开创者之一的Geoffery Hinton(2018年图灵奖获得者)

当然,知识灌输和自主学习并不矛盾,事实上,我们目前所看到的很多AI产品就是二者的结合体。这张图里更多的是希望从进化的角度看产品继承哪部分更多。

4. 当前AI瓶颈

未来AI的进化中还会有什么产物?前文提到目前AI在学术界已经意识到的一些问题,这些问题的答案也许就是未来进化的产物。这些问题我“班门弄斧”的、不负责任的把它们总结为:太短、太大、太单一

1) 太短

就Chatgpt而言,目前GPT4支持输入的prompt 长度是4000个左右token(约3000个英文单词),如果我们想让ChatGPT 看一本几万字的书,然后给出总结,这个输入就没有办法给够。不过,这一点上,或许对于ChatGPT有点太苛刻,毕竟即使对人定任务,你也不太可能会给一个人进行几千字的输入(比如这篇文章当您看到这里的时候,5716个汉字)。但在学术理论界,总是会追求更高的目标。

2) 太大

需要训练的数据量太大。我们希望AI能吸收更多的知识,目前主要是通过提供更多、更好的数据来训练。但实际上对比人类的大脑,似乎并不是数据为王的学习,譬如我们给一个三岁孩子看过20张挖土机的照片、图片、实物,他大概率就能识别出什么是挖土机。然而,对于AI,我们可能需要提供几万张训练图片。

训练数据量太大引来的一个问题是:训练成本巨大。据说GPT4一次训练的花费是一亿美元,那么假设它一个月训练1次,一年12亿美元对于微软这样的大金主,也是一笔不小的支出,更何况广大的中小公司。

3) 太单一

目前ChatGPT4的训练模态(指数据的呈现方式,比如文字、图片、视频等是不同模态)以文字为主,据说GPT4也有图片的训练样本,Open AI CEO 也表示下个阶段Open AI会将多模态作为重点研发。但多模态的训练目前在学术界仍然存在的难题是:数据如何统一,就是把一张图转化成文字,或者反之,更专业一点的话是:如何把一张图在计算机里的表征和文字在计算机里的表征可以进行相互转化。

但是,可以确定的是,这些问题已经有很多人正在解决,甚至已经存在只是还没有被发现而已(就像曾经的神经网络被抑制一样),我相信在不久的未来,AI的进化树上会有一些新的突破和产物,让AI走得更远。

总结与展望

今天分享的三张图是我看完几百个视频、论文、播客后一个大复盘,也是是我AI知识库的索引,我相信这三张图会随着我的学习持续更新。

我个人开始关注人工智能是在2020年小侄女报考大学志愿的时候,之后就一直在不温不火的学习中,到今年ChatGPT出来之后的几个月中,这种学习的速度因为工作需要而加快了。后续会以如下几个系列来分享的我的学习。

  1. 跟着图灵奖大神学习人工智能系列

这个系列是从图灵奖中挑出人工智能领域获奖的殿堂级人物,了解他们的人生经历,学习他们开创体系。图灵奖的获得者是有突破性贡献的学者,他们不一定是自己所在领域最强的人,却一定是这个领域最早的开拓者,可以把我们知识体系中任督二脉打通的人物。这个系列的标题可能是这样的(随着我的认知会微调):

AI人工智能的发展历程是怎样的?插图5

除此之外,还有以下分享:

2. AI各个垂直领域的进化史

  • 语音识别进化史
  • 图像识别进化史
  • 自然语言理解进化史
  • 图像生成进化史
  • 语言生成进化史
  • 视频生成进化史
  • 机器人进化史(这里的机器人指的是能执行物理操作的机器人,比如扫地机器人,自动驾驶汽车等)

3. 如何和孩子聊人工智能

  • Chatgpt翻译得这么好,我们还需要学习英语吗?
  • 眼见真的为实吗:机器视觉和人类视觉的差异
  • 有了chatgpt,未来的考试是什么样子的?

4. 产品背后的算法

作为AI产品经理,教你如何面对算法工程师的质问

  • 当前AI的技术边界在哪里?
  • 什么是有监督学习和无监督学习
  • ChatGPT 背后的算法
  • Mid-journey 背后的算法
  • Stable diffusion 背后的算法

5. 各种AI 产品分析

从产品经理角度分析杰出AI产品背后的成功秘诀,涵盖产品背后遵循的人性,用户体验,用户增长方式,团队组织方式等等。目前候选的产品还在筛选中,如果你遇到了可以告诉我。

我明白完成以上所有的话题实属不易,创作离不开你们的反馈,如果对你有用的话,请用关注,转发,评论来告诉我。

最后一句话希望减轻你的AI 学习焦虑:

  • 假如AI是一个长期趋势,那么稳扎稳打也为时不晚
  • 假如AI是昙花一现,就当现在时为未来准备,也不亏。

我们下次再见!

原文链接:https://www.zhihu.com/question/567083088/answer/3132729468?utm_id=0

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部