人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

ChatGPT 持续创造历史记录:AIGC,人工智能的旷世之作

2024-06-05 66

1.近期热点内容

1.1.AIGC 的一小步,AI 的一大步

ChatGPT 持续火热:ChatGPT 是一种聊天机器人软件:全名为 Chat Generative Pre-Trained Transformer,是 OpenAI 于 2022 年 11 月推出的聊天机器人,该软件使用方便快捷,只需向 ChatGPT 提出需求,即可实现文章创作、代码创作、回答问题等功能。

ChatGPT 持续创造历史记录:上线仅 5 天,ChatGPT 已经拥有超过 100 万用户,根据网易消息,在 ChatGPT 推出仅两个月后,它在 2023 年 1 月末的月活用户已经突破了 1 亿,成为史上用户增长速度最快的消费级应用程序。根据 Sensor Tower 的数据,TikTok 达到 1 亿用户用了 9 个月,Instagram 则花了 2 年半的时间。

image.png

AIGC 不仅仅是 ChatGPT:AIGC(AI Generated Content)即人工智能自动生成内容可以在创意、表现力、迭代、传播、个性化等方面,充分发挥技术优势,打造新的数字内容生成与交互形态。ChatGPT 只是 AIGC 中 AI 写作的商业化落地案例之一,其他已经实现商业化的方向包括 AI 作图,AI 底层建模,未来 AIGC 商业化发展方向还包括 AI 生成视频和动画。

AIGC 同样持续引爆市场:Stability AI 发布的开源模型 Stable Diffusion 可以根据用户输入的文字描述自动生成图像即文生图。Stability Diffusion、DALL-E 2、Midjourney 等可以生成图片的 AIGC 模型引爆了 AI 作画领域,AI 作画风行一时,标志人工智能向艺术领域渗透。2022 年 10 月,Stability AI 获得约 1 个亿美元融资,估值高达 10 亿美元,跻身独角兽行列。

image.png

AIGC 也被认为是继 UGC、PGC/UGC 之后的新型内容生产方式:UGC 是用户生成内容,起源于 Web2.0 时代,例如博客、视频分享、Youtube 等应用方案;PGC/UGC 分别指专业生产内容与职业生成内容,例如视频创收平台优酷、土豆平台节目《暴走漫画》、《万万没想到》、或是抖音、快手等用户生产内容。

我们认为 AIGC 在创作成本上具有颠覆性,而且具备降本增效的多重优势,并且有望解决目前 PGC/UGC 创作质量参差不齐或是降低其有害性内容传播等问题,同时创意激发,提升内容多样性,此外价格上 OpenAI 最贵的 AIGC 语言模型达芬奇为每 0.02 美元 750 个单词,AIGC 图型模型价格仅为 0.020 美元一张。

image.png

AIGC 的一小步,AI 的一大步:AIGC 的出现使 AI 从感知理解世界到生成创造世界的跃迁,AIGC 出现前的人工智能更偏向于分析,例如目前最火热的个性化推荐算法,AIGC 出现后的人工智能更具备“拟人化”,可以自主的创造文本、图像、视频、3D 交互内容,以及包括开启科学新发现、创造新价值和意义,因此 Gartner 将生成性 AI 列为 2022 年 5 影响力技术之一,MIT 科技也将 AI 合成数据列为 2022 年十大突破性技术之一。

image.png

AIGC 是数据和内容生产的强大引擎:AIGC 正在朝着降本增效的方向去发展,我们认为,随着 AIGC 的技术逐渐成熟,其内容生成可以覆盖从社交媒体到游戏、从广告到建筑、从编码到平面设计、从产品设计到法律、从营销到销售可能全部被 AIGC 影响或变革。

2.拐点之时,格局之变

我们认为,算力、算法、训练多模型、多模态等 AI 技术融合极大的催生了 AIGC 的爆发。

1)基础算力:人工智能的本质及数据的海量运算,相较于 AI 算法,数据才是重中之重。算力作为数据加速处理的动力源泉,其重要性不言而喻。

根据机器学习的算法步骤,可分为训练和推断两个环节,训练环节需要极为庞大的数据输入才能支持一个复杂的神经网络模型,训练过程中由于复杂的神经网络结构和海量训练数据,运算量巨大,因此对于处理器的算力、效率(能耗)要求极大。

2)算法模型:Transformer 算法是一种采用自注意力机制的深度学习模型,这一机制可以按照输入数据各部分的重要性的不同而分配不同的权重,我们现在熟知 ChatGPT 和 AI 作图等都是基于 Transformer 算法建立的;

3)预训练模型:预训练模型引发了 AIGC 技术能力的质变,在该模型问世之前,具有使用门槛高、训练成本低、内容生成简单和质量偏低等问题。

而在 AIGC 领域,AI 预训练模型,AI 预模型可以实现多任务、多语言、多方式等至关重要的作用,模型比如谷歌的 LaMDA 和 PaLM,Open AI 的 GPT 系列。

4) 多模态: 极大推升 AIGC 的多样性,预测模型更具备通用性、多样性。例如 Open AI 团队的 CLIP 模型,可以使文字和图像进行关联,比如将文字“狗”与图像进行关联,且关联特征非常丰富。

AIGC 的应用生态和内容消费市场逐渐繁荣: AIGC 在学习通用知识和理解泛化上具备更好的表现,在内容生成领域中具备以下特征。

1)自动生成内容:大型语言和图像 AI 模型可用于自动生成内容,例如文章、博客、社交媒体和帖子。

2)提高内容质量:我们认为 AI 生成内容质量较高,原因是人工智能模型可从大量数据中学习,且信息准确,例如 DALL·E 的效果已经接近中等画师的水平。

3)增加内容多样性:AIGC 模型可以生成多种类型的内容,包括文本、图像和音视频、3D 内容等,这些内容可以和专业认识创建更多样化、有趣的内容,有望吸引更广泛的人群。

4)内容制作成本低:基于 AIGC,内容制作的成本显著降低、效率显著提高,且可以创造出有独特价值和独立视角的内容。

5)可实现个性化内容生成:人工智能模型可根据个人用户喜好生成个性化内容,例如 Stable Diffusion 的二次元画风生成工具 Novel-AI,可以满足小众二次元群体的喜好和内容需求。

AIGC 前景广阔,且已经有多种落地场景:比如目前火热的 ChatGPT,ChatGPT 是采用 WEB 浏览器上的对话形式交互,可以满足人类对话的基本功能,能够回答后续问题、承认错误、质疑不正确的请求,我们认为 ChatGPT 的编码能力和 AI 问答系统能力已经大幅提升,并且可以一定程度上替代搜索引擎。

image.png

此外,数字人也是 AIGC 的应用场景之一:数字人是数字智能体智能交互的新模式,目前已有诸多应用,包括元宇宙应用的 NPC 虚拟角色、用户虚拟等。

AIGC 大大提升了数字人的制作能效,用户可提供图片、视频,通过 AIGC 生成写实的类型数字人,具有时间短、成本低、可定制特点,同时,3D 数字人建模已经初具产业化。

此外,AIGC 支撑了 AI 驱动数字人多模态交互中的识别感知和分析决策功能,使其更神似人。

image.png

AIGC 具有强大的生成能力,可以辐射其他领域:比如医疗、辅助设计等行业。例如 AIGC 语音生成可以帮助病人“开口说话”,例如彼得·斯科特-摩根,英国机器人科学家,于 2017 年确诊渐冻症后通过多次手术将自己改造为了世界上首个“人类赛博格”。

他联系了 CEREPROC 语音解决方案的厂商将蕴含不同情绪的语料与词组构成数据库,最后通过 3D 虚拟人物完成公开场合的讲话。AIGC 还可以助力文物修复,例如百度公司借助 AIGC 图“修复”《富春山居图》。

AIGC不止于此,前景广阔:AIGC有望成为3D互联网的底座,其中包括3D建模、场景、角色制作,同时激发创作者的灵感。

以 2018 年《荒野大镖客 2》为例,60 平方公里的虚拟场景,需要六百余美术建模师历经 8 年完成,而 2022 年《黑客帝国:觉醒》利用了 AIGC 技术,虚拟城市共包括 700 万个实例化资产其中包括 7000 栋建筑、38000 辆可驾驶的车辆和超过 260 公里的道路,制作效率大幅提升。

此外,AIGC 有望生成 3D 图片,但现在仍处于摸索阶段,生成速度和质量仍需提升。

image.png

AIGC 有望作为生产力推动元宇宙的发展:元宇宙最大的特征之一在于其可拓展的发展潜力,而最大的问题是如何建立内容,元宇宙的 3D 建模仅依靠人工设计和开发无法满足其需求,我们认为随着 AIGC 的技术逐渐成熟,元宇宙才可能以低成本、高效率的方式满足海量用户内容需求。

AIGC 产业化加速形成,模型即服务的商业模式正在打开:目前,AIGC 产业体系雏形已初步显现,分为上中下三层架构。

第一层为基础层:就是由预模型 AIGC 技术搭建的基础设施层,目前企业为头部科技企业例如 OPEN AI 和 Stability 等。

第二层为中间层:即垂直化、场景化的模型和应用工具,通过使用基础层的模型生成应用程 序,供应用层使用可以在基础层的基础上快速生成场景化、定制化、个性化的模型和程序,例如 Novel-AI;

第三层为应用层:即面向 C 端用户文字、图片、音视频等内容生成服务。

image.png

OpenAI 的商业模式是 API 接口收费:客户可以通过 OpenAI 的强大 AI 模型构建应用程序,例如访问执行各种自然语言任务的 GPT-3、将自然语言翻译成代码的Codex 以及创建和编辑原始图像的 DALL·E。

公司按照不同项目的 AI 模式和不同需求进行收费,对于 AI 图像系统按不同的图片分辨率定价;对于 AI 语言文字系统按字符单价收费,对于调整模型和嵌入模型按照文字单价收费,并根据不同的调用模型区别定价。

目前 DALL·E 方面,已有超过 300 万人在使用,每天生成超过 400 万张图像。

其 API 具备快速、灵活、可拓展等性质。OpenAI 的商业模式属于底层模型开放性标准化 SAAS 服务模式:公司通过提供相关AIGC代码,提供自动图形模型或语言模型生成等产品,用户通过其API接口接入,并支付平台费用获取相关图像、语言、代码调整服务,OpenAI 可获得付费订阅式的 SAAS 费用,我们认为该商业模式用户粘性极强。

目前我国 AIGC 商业仍处于初期阶段,部分文本、图像等生成的公司仍处于初期阶段,以辅助生成内容服务为主,部分公司已经进入 AIGC 开发阶段,但仍处于免费试用、获取流量阶段,我们认为未来相关公司 SAAS 模式有望形成。

image.png

我们认为 AIGC 的出世会产生革命性的影响,同时有望赋能千行百业,随着 AI 写作、AI 作图、AI 底层建模、AI 生成视频和动画技术逐渐成熟,AI 有望进入新纪元,带来空前蓝海,同时对现有娱乐、传媒、新闻、建模等应用具有颠覆性的创新。

我们认为 AIGC 的受益厂商分为三类:

1)AI 处理器厂商;

2)AI 商业算法商业落地的厂商;

3)AIGC 相关技术储备的应用厂商。

具备自研 AI 处理器的厂商可以为 AIGC 的神经网络提供算力支撑:人工智能的本质及数据的海量运算,相较于 AI 算法,数据才是重中之重。

算力作为数据加速处理的动力源泉,其重要性不言而喻。AI 处理器芯片可以支持深度神经网络的学习和加速计算,相比于 GPU 和 CPU 拥有成倍的性能提升,和极低的耗电水平。因此,人工智能芯片将发挥大量作用。

具备 AI 商业算法落地的厂商具备相关算法的领先性: AI 算法的龙头厂商在自然语言处理、机器视觉、数据标注方面都具有先发优势。

算法上,数据标注属于 AIGC 算法的生成关键步骤,而在自然语言处理、机器视觉等方面,AIGC 已经对此方向应用产生深远影响,例如已经实现的虚拟人与自然人的对话、AI 作图、AI 底层建模,随着技术的进一步成熟,AIGC 势必对该方向应用产生革命性影响。

AIGC 相关技术储备的应用厂商有望打开海量市场:相关娱乐、传媒、新闻、游戏、搜索引擎等厂商具备海量文本创作、图片生成、视频生成等需求,随着 AIGC 的逐渐成熟,相关 AI 算法不断成熟完善,并结合相关应用,我们认为相关厂商在降本增效的同时,有望提升其创作内容的质量、减少有害性内容传播等问题,实现创意激发,提升内容多样性,AIGC 有望极大推动相关厂商商业化的发展,从而打开海量空间。

3.行业相关公司介绍

我们认为 AIGC 的出世会产生革命性的影响,同时有望赋能千行百业。

我们梳理了三条路径图:

1)具备自研 AI 处理器的厂商:受益标的为寒武纪、商汤、海光信息;

2)具备 AI 算法商业落地的厂商:科大讯飞、拓尔思,其他受益标的为:汉王科技、海天瑞声、虹软科技、云从科技、格灵深瞳;

3) AIGC 相关技术储备的应用厂商:受益标的为万兴科技、中文在线、阅文集团、昆仑万维、视觉中国。

科大讯飞: 自然语言处理的全球龙头厂商

科大讯飞于 2022 年初正式发布了“讯飞超脑 2030 计划”,其目的是向“全球人工智能产业领导者”的长期愿景迈进。该计划是公司的核心战略,目的是构建基于认知的人机协作、自我进化的复杂系统,即让机器人感官超越人类,具备自主进化的能力,打造可持续自主进化的复杂智能系统,助力机器人走进千家万户。

其计划分为三个阶段性里程碑:

image.png

拓尔思: 语义智能领导者,数据要素市场综合服务商

公司成立于 1993 年,主营业务包括人工智能产品及服务、大数据产品及服务和数据安全产品及服务等,已成为数据要素市场综合服务商。

人工智能领域,公司专注于语义智能技术的研发和产业化。语义理解相比语音识别和图像识别,更加复杂,难度更高,需要“数据”和“知识”双轮驱动。大数据领域,公司具备数据获取、数据治理、数据检索、数据分析挖掘全生命周期的技术能力。

数据安全领域,公司子公司天行网安提供数据安全传输和交换产品及服务。

image.png

汉王科技: 人工智能领域领先者

汉王科技是人工智能领域领先者:成立于 1998 年,是人脸识别、大数据、智能交互技术、产品及服务的提供商。公司以核心技术为基础,面向市场需求,已形成了以识别技术为核心的、针对不同细分市场的软硬件产品系列,既有通用产品,如 e 典笔、汉王电纸书、汉王笔、文本王、名片通、绘图板等。

公司主营业务分别是:1、笔智能交互业务,公司在笔智能交互方面的技术主要分为电磁触控及电容触控两大类;2、文本大数据业务包括智慧司法、智慧档案、智慧人文、智慧教育、智慧金融等;3、人脸及生物识别;4、相关 AI 终端。

image.png

云从科技: 人机协同生态体系赋能商

云从科技是一家专注于提供人机操作系统和行业解决方案的人工智能企业,致力于推进人工智能产业化进程和各行业的转型升级。

公司业务分为两部分:

1、人机操作系统:通过底层 AI 业务流程引擎和决策支持系统,优化人机交互体验,提升业务流程执行效率,让人机具有决策功能,包含人机协同和整体操作系统、“轻舟平台”的服务平台及配套 AI 应用的 SaaS 服务。

2、人工智能解决方案,包括智慧金融、智慧治理、智慧出行、智慧商业的四个领域综合解决方案。

image.png

弓中号:搜索老范说股

原文链接:https://www.bilibili.com/read/cv21651021/

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部