以下文章来源于深 AI ,作者深 AI 团队
来源 | 深 AI(DeepAI2023)
作者 | 黎明 编辑 | 魏佳
今年 3 月底的某一天,在北京创业的王登科,突然有了一个强烈的想法——克隆自己。
他很早就想做一个聊天机器人。今年以来,ChatGPT 的爆火,llama 和 chatglm6b 等开源模型的出现,让他觉得,或许是时候了。
他决定试试看。
基于 10 万条微信聊天记录,280 篇博客文章,他花了几个晚上的时间,在 chatglm-6b 预训练模型的基础上,训练出了自己的数字克隆人。而且,实现了像模像样的聊天。在第一次对话中,他的克隆人就学会了骂人。
王登科第一次和他的聊天机器人对话时,
对方说了脏话
为了让 AI 更像自己,他又进行了多轮优化、训练,最终得到了一个相对理想的版本。现在,所有人都可以在一个网页上,跟他的数字版聊天。大部分时候,你几乎很难区分,屏幕的另一侧并非真人。
在王登科跟另一个 ” 自己 ” 瞎聊的同时,一些有野心的科技公司,正在紧锣密鼓开发自己的大模型,然后试图像流水线一样批量生产 AI 克隆人。
这是一个潜在的大市场,已经被科技公司盯上。从野生网红,到娱乐明星,再到科技圈大佬,人人皆可被 AI 克隆,然后被售卖。
这或许是一条流量变现的新路子,是一个全新的商业模式,也可能是人类社交网络崩塌的开始。
” 我需要一个分身 “
连续创业者邱懿武,是浙大创业圈里的活跃分子。
两个月前,邱懿武用开源大模型,结合自己过去的交流和文章,做了一个 ” 邱懿武 GPT”。这是一个铜人形象的数字版分身,能模仿他的说话方式、语气、个性跟人聊天。
他想用自己十多年的经验和思考,去训练一个更懂自己的永生体,然后用它去提供咨询和交流。
这并非痴人说梦。” 大模型技术到了拐点,现在 GPT4 的表现,已经超越了图灵测试,这意味着你已经区分不出来是人还是机器。” 邱懿武对深 AI 说。
他迫切需要一个 ” 分身 “。自动去年启动 ” 造物云 ” 的创业项目后,他开始忙起来,很多时候感觉分身乏术。
他想开一门设计课程,传授一些审美知识和设计技巧。他还想开一门创业课,把自己多年积累的经验,总结的方法论,统一对外输出。
现在,他认为 GPT 可以帮他完成这项繁琐的工作。” 让我的分身去全国各地开课,每天都可以讲,我自己都不用出镜。” 他认为,以目前的技术,有些录播课程完全可以用 GPT 分身出镜,一些需要即时互动,甚至自己生成讲课内容的课程,可能还得等技术更成熟一些。
事实上,已经有人拥有了自己的数字版分身,并开始打工赚钱了。
润米咨询创始人刘润在抖音上有 100 多万粉丝,据他介绍,从去年 10 月开始,由人工智能公司硅基智能为他定制的数字人上线,后期他出镜口播的一些短视频,都是由这个数字人完成。他只需要提前准备好口播的文字稿,录好一段音频,数字人就可以出镜讲解,你很难区分真假。
刘润的口播短视频页面
通过这种方式,刘润的时间精力被解放了。
这背后的技术原理不复杂。人工智能让机器学习了刘润之前的视频,捕捉了他的神态、表情、动作,然后高像素模仿,生成跟真人出镜一样的视频。目前,做类似技术的公司很多,实现起来难度不大。甚至在二手交易平台闲鱼,你都可以找山寨商家定制一个自己的数字分身。
这只是初级版的数字分身。再往前进阶,是 AI 克隆人。AI 克隆人是数字人中一个特别的类别。
美国的 Forever Voices 公司,从声音克隆切入市场。创始人 John H. Meyer 提及自己的创业初心时,讲过这样一段故事:六年前他的父亲离世,让他经历了人生中最艰难的时刻,直到今年 4 月,借助 AI 的力量,他用 Forever Voices 打造了一个聊天机器人,实现了跟父亲的再次语音交谈。
在对话框中,这个机器人有跟他父亲完全一样的声音、语气、说话方式。更重要的是,对方可以跟你实时互动,说的话不是提前录制,而是即时生成的。
” 用 AI 的形式保存自己,让数百年后的几代人与你交谈。”John 说。
就是在这个机器人的基础上,Forever Voices 为女网红 Caryn Marjorie 打造了一个克隆人,粉丝可以花 1 美元 / 分钟,和 AI 版的她聊天。Caryn Marjorie 在美国社交平台 Snapchat 上拥有近 200 万粉丝,它由此实现了同时跟 1000 个男粉丝聊天,并在一周内赚到了 72000 美元。
女网红 Caryn Marjorie
这很大程度上得益于 GhatGPT 的诞生。GhatGPT 能理解用户的意图,跟真人一样与你聊天。Forever Voices 就接入了 GPT-4 的 API。
之前,无论是声音克隆,还是形象仿真,都有一些局限。用 AI 声音合成复制任何人的声音,用深度伪造进行 AI 换脸,早已被骗子用来诈骗。但它们的使用场景有限,尤其是在实时互动上表现较差。
今年大火的生成式 AI,让机器使用自然语言处理(NLP)来理解和响应用户的文本和语音消息,以更像人类的方式跟人类交流。并且,机器学习消化了被克隆对象的所有历史资料,还可以从与用户的交互中学习,并随着时间的推移改进其响应效果。
从录播模仿,到即时生成,AI 打造的数字人越来越像真人,开始在更多场景里解放生产力。从交互体验的角度,机器学会了自我演绎,它不再是一个复读机,更像一个 ” 有血有肉 ” 的具体的 ” 人 “。
流量变现的新路子
科技公司研发新技术,让 AI 克隆人变成现实,目的不是炫技,也不是要制造玩具。这或许,是一条流量变现的新路子。
Forever Voices 公司为女网红 Caryn Marjorie 打造的 AI 聊天机器人,只是其明星克隆人计划的一部分。
这家公司瞄准大量公众人物,如乔布斯、马斯克、Taylor Swift 等,建立他们的虚拟形象,让人们体验跟名人语音聊天的感觉。他们实现了让 AI 版本的乔布斯,与 AI 版本的马斯克对话。那段演示视频吸引了大量用户围观,让这家公司火速出圈。
用户如果想跟这些虚拟名人进一步聊天,需要按时长付费。这是一门几乎稳赚不赔的生意,因为克隆人一旦被 AI 创造出来,可以同时跟成千上万个人聊天,边际成本为零。它实现了将流量规模化、批量化、流水线式的变现。5 月 14 日,女网红 Caryn Marjorie 在社交媒体宣布,他的 ” 男友 ” 数量超过了 1 万个。
在中国市场,小冰公司的探索更为激进。
小冰公司在 5 月 16 日宣布启动 “GPT 克隆人计划 “,最短只要采集三分钟数据,即可为明星红人、专家学者或普通人创造源于本人性格、技能、声音、外貌的 AI 克隆人。
明星红人是其一大卖点。首批上线的 AI 克隆人中,关注度最高的一个,是此前争议很大的女网红 ” 半藏森林 “。
在流量变现上,小冰公司非常直接。
按照小冰公司的规则,任何人都可以在小冰的平台上创造克隆人。克隆的对象可以是你自己,也可以是其他人。你可以用公开数据克隆一个周杰伦,也可以克隆一个马斯克,然后跟他对话,还可以把它分享给其他人。
深 AI 和 ” 周杰伦 ” 的聊天记录
这其中最神奇的地方在于,你创造的克隆人在加 V 认证后,可以有偿对外 ” 接单 “。目前克隆人的 ” 营业范围 “,主要是陪伴式在线聊天。当有人付费后,小冰平台抽走一部分,剩下的都是你的。
对于有粉丝基数的明星而言,这简直是流量收割机。一个明星的精力再旺盛,工作室再庞大,也不可能做到即时回复粉丝私信,更别提长聊了。
克隆人能做到 24 小时在线,秒回消息,文字语音表情包灵活应用,关键是,它的知识储备、说话方式,几乎跟真人一样。
情感、社交和偶像崇拜,是现代生活中最重要的精神需求。从制造偶像到复制偶像,AI 创造了一种新的商业模式。小冰公司 CEO 李笛说,” 实际上这是种 C2C(消费者对消费者)的商业模式,也是目前为止在 AI 大模型普及后,出现的第一个 C2C 的商业模式。”
抛开背后的道德和法律争议,这是一个看起来相当性感的商业模型。AI 虚拟聊天和情感陪伴,一直以来就是一个潜力巨大的市场。如今生成式 AI 技术的成熟,给这门生意添了一把火。
在 Forever Voices 和小冰公司推出产品之前,去年底国内就有一款叫 Glow 的产品小火了一把。
Glow 的玩法是在应用中创建虚拟 AI 机器人,用户可以创造属于自己的机器人,设定人物背景、性格、价值观等特征,实现实时沟通、互动并建立情感连接。通过后续的对话训练,还可以调整机器人的语气、说话方式等等。
这款产品上线后,只用 4 个月时间,积累了接近 500 万用户。其背后的人工智能创业公司 MiniMax,现已估值超过 10 亿美金,晋升 AI 独角兽序列。
人人都是 ” 数字仓鼠 “
邱懿武认为,AI 克隆人商业化是一个必然的趋势。” 这本质上就是 IP 授权,属于虚拟经济的一种,把人也数字化了。”
通过克隆自己,人类实现了自己商业价值的延伸。” 虽然我不是娱乐明星,但我把自己做设计的经验总结成方法论,服务不了太多人,那就让我的机器人去做好了。” 他说。
他现在会有意识地把跟自己相关的数据记录下来,以作为将来克隆自己的养料,目的是要让自己的记忆留存在数字世界。
今年以来人工智能技术的突飞猛进,让越来越多人觉得,科幻电影中的情节,或许会在某一天在真实世界上演。
不过在王登科看来,现在所谓的 AI 克隆,更像是扮演,而不是真正意义上的克隆。
刘润数字人是真人写好脚本后,用一个模型生成声音,用另一个模型去让声音驱动虚拟形象,模拟人的口型和表情说话。
一些公司做的克隆人,是对文本大模型进行预训练,然后结合名人的公开数据,对名人进行扮演。AI 对名人的扮演会更逼真,因为名人的数据更多。只要原本的底层模型足够好,扮演名人就非常容易。
王登科认为,这都不是他想要的克隆。AI 只是根据人类输入的信息在做反馈,还不能自主地跟人一样去应对。
他想用大量本人产生的原始数据,从底层去训练、改变模型的结构和参数,使模型本身就具备跟自己一样的知识、性格、习惯、说话方式。这就像是在大模型上接入了一个有自己参数的插件。
但在试图克隆自己的过程中,他陷入了一种矛盾心态。
” 我某种程度上挺讨厌 AI 克隆,它可能会消解人类存在的意义。提高效率是好事,效率提高到极致,就是不需要效率了,人也不需要创造了,那人存在的意义是什么?” 他对深 AI 说。
这不是一个技术问题,而是社会伦理问题。
如果有一天,AI 克隆人变成科技巨头的赚钱工具,变成普通人的商品和玩具,成为另类意义上的 ” 电子宠物 “,这对人类是更好还是更坏?
AI 克隆人还处在发展早期。对于人类而言,AI 大模型就像一个黑盒子,人类还没有彻底搞清楚它是如何运作。” 你扔进去一堆数据,一轮一轮跑,最后反馈出一个结果,但它到底训练了什么,改变了什么,为啥参数变化了,没人知道。” 王登科说。
《大模型时代》作者龙志勇也对深 AI 说,大模型现阶段就是靠做黑箱实验来验证能力,靠做黑箱训练来提升能力。
永远保持敬畏之心,或许是我们迎接 AI 时代最好的方式。
* 题图来源于《银翼杀手 2049》。
原文链接:http://www.myzaker.com/article/64a10fa38e9f093b9c01cecf