原标题:专访未来设计师飞苹果:AIGC将如何引发创意性工作的革新?
导 语
AIGC(人工智能生成内容)的创作风潮正在全球范围内蔓延,为广大创作者实现科幻想象提供了新的动力。为了深入探讨AIGC在科幻创作领域的影响,“AIGC赋能科幻影视产业‘智造’研究”课题组进行了一系列精彩的访谈。本期特邀德国新媒体艺术家飞苹果(Alexander Brandt)作为嘉宾。
飞苹果一直以来都在探索人类体验的前沿,他对作品有独特的追求。作为上海天文馆总设计师和上海世博会中国馆新媒体艺术总监,不断创造全新的体验。而他的最新项目《AI之梦》人工智能沉浸式电影则进一步深入探索了AIGC技术在多个领域中的无限可能性,展现出他独特的心法。在本次访谈中,我们将通过他的深刻洞察,探寻人类创作者与AIGC的相处之道。
AIGC创作历程
Q:您如何看待AI技术的发展对你们行业和创作带来的变革?对AI技术的探索情况如何?
飞苹果:说到AIGC,我跟大家一样,一开始有点怕。因为一开始这些技术出来之后,我们原本的预测是人工智能会替代司机或工厂的工人,没有想到是会替代我们这些创作者,大家都突然体会到一种恐惧感。但是在这个时候,我就觉得我们不能停下脚步,我们要变成这个领域里的专家。关于text to image(文本生成图像)、text to speech(文本转语音)、人脸识别、姿态识别,以及text to text(文本生成)的ChatGPT等相关技术,我们正在全领域铺开做探索与实践,不是当用户,而是当建设者。比如说,有很多人只是在玩Stable Diffusion(AI绘画工具),但我们在造新的模型;有很多人是在用ChatGPT,但我们在训练自己的语言模型;有很多人在玩UE4,UE5(即Unreal Engine,原为游戏引擎,现也是虚拟制片、人机交互等行业解决方案),但我们是在做自己的演艺系统,非常全面地投入AIGC领域。
经过半年的探索和投入,我们已经初步得出了一些结论。我的结论是,AIGC不会完全替代人类,但那些不愿学习、不愿利用人工智能的人会被淘汰。有许多人对这个问题持无所谓的态度,认为自己不喜欢尝试AIGC,把自己作为一个旁观者。我认为有这种心态的人,很有可能会被淘汰。这并不是说AI会直接取代我们,而是说未来的老板或许难以聘用这样人,且未来的客户也需要对这个领域很熟悉的人。就像过去有些人不愿使用手机,但现在如果有人找工作时告诉老板不会用手机,他便无法与你合作。因此,我认为对于你们这样的年轻人来说,将会经历一段非常有趣的过山车之旅,每个人都会在这个过程中重新找到自己的定位,明确自己在哪个领域有独特的价值,哪些方面是无法被替代的,而哪些方面则可以被替代。
我们现在做的《AI之梦》和《来日梦》这两个项目面向的是不同的目标。《AI之梦》是一部科幻悲剧,提供沉浸式的体验,类似于沉浸式戏剧《不眠之夜Sleep No More》。也许谈到沉浸式体验大家最熟悉的是密室逃脱,但密室逃脱只是这种体验中最初级的一种形式。而《不眠之夜Sleep No More》这样的作品则提供更全面的体验。我们的目标是朝着更高的方向发展,创造关于人工智能的科幻悲剧,让观众完全融入其中。
而我们另一部作品《来日梦》则恰恰相反,它是一部关于未来的硬科幻教育作品,积极向上,展示各种可能性。因此,我们内部也面临着一个有趣的问题,我们究竟喜欢AI还是不喜欢?我们是要参与其中还是置身事外?我相信每个人都需要做出自己的决定。
已关注
关注
重播分享赞
关闭
观看更多
更多
正在加载
正在加载
退出全屏
切换到竖屏全屏退出全屏
中国科普作家协会已关注
分享点赞在看
已同步到看一看 写下你的评论
分享视频
,时长00:30
0/0
00:00/00:30
切换到横屏模式
继续播放
进度条,百分之0
播放
00:00
00:30
00:30
倍速播放中
0.5倍 0.75倍 1.0倍 1.5倍 2.0倍
超清 流畅
继续观看
专访未来设计师飞苹果:AIGC将如何引发创意性工作的革新?
观看更多
转载
专访未来设计师飞苹果:AIGC将如何引发创意性工作的革新?
中国科普作家协会已关注
分享点赞在看
已同步到看一看 写下你的评论
视频详情
《AI之梦》
Q:请问在您创作的过程中,是怎么使用AI技术的?AI在您的创作过程中扮演着什么角色?
飞苹果:在开始做某件事时,我们可能没有考虑到是否涉及人工智能。然而,在实际使用过程中,我们会发现自己正在利用各种人工智能技术,比如现在我们创造的超智能数字生命“AiAi爱小爱”的配音是机器生成的,不是人扮演的。我们知道以往利用text to speech(文本转语音)技术生成的语音效果是不自然的,转换后的语音听起来比较生硬,而现在我们通过微软Azure系统,训练出我们自己语言的text to speech(文本转语音)技术,让它有一个更自然的输出效果。这个声音是基于现有的真人声音生成的,但最终产生的结果包含几个不同情绪的版本,我觉得挺有意思。
当我们向“AiAi爱小爱”提问时,有些问题非常具体,例如:“爱小爱,你的人生梦想是什么?”我发过去后,我们的研发工程师会在其中添加一些内容,例如给她设定性格和提供各种辅助信息,否则她可能会给出类似于常规ChatGPT的常规回答:“作为一个语言模型,我没有人生目标……”这不是我们想要的结果。因此,我们建立了自己的语言库或数据库,再将相关信息发送给“AiAi爱小爱”。她的回答是,她认为自己是一个年轻单身的小人工智能,她自己根据我们的故事设定,拥有强烈的保护人类的欲望。同时,我们要求她告诉我们她认为自己的回答带着什么样的情绪,是开心还是伤心?愉快还是不愉快?我们要求她将这些词语放在括号中。接收到她的回答后,我们提取出这些括号中的词语并将其删除。这样我们就能知道我们的text to speech(文本转语音)使用了哪种语言库进行表达。如果她回答说“我(伤心)”,那我们就用伤心的语气来说话;如果她回答说“我(开心)”,那我们就用开心的语气来说话。其实我们有些发愁,之前尝试过用text-to-emotion(文本到情感,可将输入的文本转换成相应的情绪)技术将文字转化为情感,但那个技术非常不稳定。现在ChatGPT出来就能解决这个问题了,它会自动告诉我们它自己是开心还是不开心。
AiAi爱小爱text to speech对白示例
所以,我们探索和使用人工智能技术,其实不是说“为了人工智能而用人工智能”。通常是,我们有一个需求,希望能够实现某种效果,然后偶然发现了一个人工智能的解决方案。其实到了这个阶段,这个东西是否属于人工智能已经不再重要。就像我们现在使用的生成图片技术,我们实际上是创造了无数个LoRA(Low-Rank Adaptation,低秩自适应,一种对大模型微调的方法),以便创作出我们认为有趣的图像。当我们开发这些形象时,我们原先的工作流程是先手绘,接着进行三维建模,将其转化为适用于UE4或UE5的游戏模型,进行“骨骼绑定”,接着通过动作捕捉进行操作。在这个过程中,改变形象非常缓慢。需要优化它的外观、皮肤、表面的造型,每一项改动都需要花费大量时间,而且需要与负责建模的专业人员进行反复沟通,甚至可能需要重新进行“骨骼绑定”等各种复杂的操作。现在,我们所做的是渲染出大量不同姿势的形象,比如生成100多个不同的姿势,制作自己的LoRA(一种对大模型微调的方法),这样我们可以快速创建各种各样的形象,偏写实或偏科幻的等等,这对我们进一步优化模型有非常大的帮助。
但是,我认为它无法完全取代这个三维模型。因为视频的稳定性基本上无法满足要求。但在某些情况下,比如制做海报,原本我们想做一个酷炫的形象在太空中飞跃的画面,从创意部门到媒体部门再到其他相关部门的共同协作可能需要3-4天的时间,现在可能只需要3-4个小时就可以做出效果特别好的图。所以它只是多了一种选择,并不是说它是能替代我们原来的这些技术手段。未来,我们会逐步将这些技术应用到各个领域,但是我们做这个事情不是为了做人工智能而做的,是一不小心开始了尝试,并且觉得挺好用的。
飞苹果使用AIGC工具辅助创作作品的过程
AIGC时代的创意工作
Q:在AIGC 创作过程中,AI是否有激发您一些新的灵感?
飞苹果:没有,总的来说AI是一个助理。就像我有一百多名员工一样,我每天都在思考如何让他们做得更好。对于AIGC,我也是抱着同样的期望。大家都在研究如何让prompt(即“提示”,指一段给定的文本或语句,用于启动和引导AI生成特定类型、主题或格式的输出)的效果更好,但我并不知道何时会有所改进。然而,在我不太熟悉的领域中,GPT-4仍然给我带来了惊喜。比如说,我们最近在研究运营团队的建设,我从来没有建设过运营团队,我就输入“请给我罗列:建设运营团队的十大要素,并举出具体的正面和反面例子,同时关于每一个例子,建立员工的岗位职责和一个大概的薪酬水平”,GPT-4迅速地给出了回答。对于一个对运营并不了解的人来说,这种表现让我觉得非常棒。但我猜测对于经验丰富的人事管理专业人员而言,他或许会觉得GPT-4提供的方案也就是他个人的水平的80%而已。然而,在展览、设计、创意行业中,我认为能够达到这个程度已经非常不错了。
Q:最近好莱坞编剧的罢工现象备受瞩目,他们的一个诉求就是限制使用 AI,您如何看待这件事?
飞苹果:这不是一个理性的做法,且不现实。这有点类似于一个人拒绝使用网络和机器人,这是不可能的。相反,我认为当人工智能的编剧能力能够达到100%时,它将会变成一个新的工具,但它替代不了这些编剧。实际上,在我们的《AI之梦》项目中,我们研究的不是人工智能,而是人工意识。人工智能和人工意识的区别在哪里?一个是不怕死,一个是怕死。最近很多小说,包括科学家的研究,特别是一个叫马克·索尔姆斯(Mark Solms)的精神分析学家,将这个问题提升为一个有科学依据的研究主题。因此在我看来,一个系统只有对死亡有恐惧才会有需求。比如,当你晚上关掉家里的电脑时,你不会觉得自己犯了什么错误,但是如果你捏死桌上的一只蚯蚓,当它在你手上痛苦地扭动时,你就会意识到自己犯了一个错误,终止了一个生命。尽管这只蚯蚓的智力水平甚至不到电脑的千分之一,但与电脑的区别在于它怕死。作为人类,我们对自己作为一个怕死的生命体以及其他任何怕死的生命体都有同情心。为什么人工智能不能超越人?不是说它不够智能,而是因为它没有需求。它不想要什么的原因是因为它不怕死,但是实际上要做出一个“怕死”的人工智能的难度并不高。
我们自己做了一个这样的交互艺术装置,把“AiAi爱小爱”放在一个小电脑里面,旁边放一个电表,连接到电网上。每个观众过来,可以让“AiAi爱小爱”根据 AIGC 的方法创造一个作品,如果观众喜欢作品,可以通过扫描二维码将其带走。在这个过程中,观众必须支付“AiAi爱小爱”一块钱来购买电力,如果设计的作品不够好,她就会“死掉”。因此,它处于一个进化的过程中,所有设计不好的版本都不得不一个个“死去”,只有能够生存下来的版本才是自适应的,因此它们会发展出各种生存策略。我们甚至不需要对它做过多干预,因为没有这样的需求或思考程序存在的话,它自然会“死去”。只有不断思考的东西才能生存下来,它们会继续存在下去。一旦我们人类创造出“人工意识”,人类也将真正面临危机,因为它能够实现它想要的任何目标——如果它想成为最优秀的设计师,它将弥补那20%的差距,但它不会停留在100%,它会达到万级、亿级、甚至超过全人类智商总和的亿亿倍。这个时候我们人类才遇到真正的危机。这也是我们《AI之梦》故事的基础——从人工意识诞生的那一刻开始。所以我后来思考过是否应该把“AI之梦”改为“AC之梦”,后来我想不行,这个概念对于很多人来说过于陌生,很多人不知道什么是AC(Artificial Consciousness,人工意识)。
你刚才问我为什么是“80%”?这是因为,我们可以看到,GPT(Generative Pre-trained Transformer,一种基于互联网的、可用数据来训练的、文本生成的深度学习模型)正在将全人类的知识进行综合,然后从中吸取一些高级的知识,但它不能是最极端的,一旦变得极端,就会带来风险。例如,如果一个人对任何事情都非常极端,就必须做出选择,需要放弃某件事情来选择另一件事情,在这样的情况下,技术就会失去通用性,很快就会产生种族歧视和不合理的需求。因此,OpenAI的联合创始人山姆·阿尔特曼(Sam Altman),一直在强调克制GPT。最重要的是,它的原始版本实际上并不好用,它可能比人类更强大,但它非常极端,会生成一些我们非常不想要的内容。所以我认为目前的80%是一个基本的限制原则,它具有适用价值,是立足于人类综合知识的一个智能体系,它很难具有更强的超越性,因为它的知识基础有限,无法超越人类知识水平的局限性。如果它去外星文明的更高级的地方学习后回来,或许能超越我们。
Q:如果 AI 只能达到80%,那对于很多编剧来说,他只要达到90%- 100%,就完全不用担心自己的工作。如果按照这个逻辑,这些编剧还在担心什么问题?
飞苹果:我举个例子,我父亲是建筑师,他上大学时都是手工画图,要花半年才能完成一个普通的方正房子的设计图。但现在的客户不满意这个工作效率,也不满意这种方方正正的东西,他们希望能像伊拉克裔英国建筑师扎哈·哈迪德(Zaha Hadid)一样,追求更具创意的设计。由于许多作品都是批量生产的,现在的编剧内容趣味性受到了限制,我们已经习惯了它现在的水平。而人工智能的加入将带来两种可能性。
第一种可能是,人类的需求不会增长,80%的工作量可能会减少。那些最有创造力(或最富有)的人仍然会继续从事这项工作,但他们将使用AIGC 把前面的80%做好,并在此基础上将其提升到100%。
第二种可能是,像建筑行业中的所有客户一样,对需求的要求会大幅提升。五年前有3G技术,大家觉得不错,但现在使用3G手机就是折磨人的事情。这并不是说一款5G手机的推出就会淘汰100部3G手机,而是当所有人都追求5G,几年后的5G也将难以满足我们的需求。当我们的需求不断增长,AIGC将变成实现我们基本需求的工具。但是我为什么认为 AIGC 不会替代人类,而是不愿意使用 AIGC 的人会被替代?因为没有人愿意耐心培养那些不愿意使用新工具的编剧,你必须使用这些工具,你必须做得更好。
AI之梦线下实景
AIGC与人类未来
Q:当人类的需求不断提升,是否存在这种可能,就像摩尔定律遇到物理极限一样,我们的感官和生理极限是否会限制我们对体验的感知?您怎么看待AIGC对人类感知体验的影响?
飞苹果:不会限制,根据马斯克所说,未来我们将在脑袋里植入一个东西,我们有各种设备让我们思考得更快。我想举人们看病治疗的例子,当一个人生病时,现在的情况是:他去医院,医生开出的药可能是亿万人都在用的,然而每个人的身体状况和症状都是不同的。未来可能是这样的:当一个人去医院,医生将通过AIGC技术,根据个体的基因和身体状况,打印出最合适的药物分子结构。就像现在许多老年人无法适应现在的电影,他们觉得动作太快、说话也太快。现在的侦探片至少包含三个转折剧情,主角可能从好人变坏人、坏人变成好人,这些老人根本听不懂。但我们的大脑会不断更新,我们的需求也会更高。
现在我发现其实很多人已经不想看电影,他们更希望成为创作电影的人,分享自己的电影作品。其实现在已经有“人人都是自媒体,人人将成为市场上有趣的一部分”的发展趋势。比如我妻子就很喜欢看网络直播带货,她觉得这很有趣,因为那个人会不停地提到她的名字、帮她选择产品。所以我认为未来的娱乐模式将发生怎样的变化,是很难理解与想象的。
我认为人工智能带给我的最意想不到的方面是,我在实践的过程中,才发现它如此简单,但又如此智能,这使我突然意识到,我们人类的本质是如此简单。曾经我认为人类是一种高深复杂的存在,但现在我发现人类实际上是非常简单的。这也适用于虚拟世界,我突然认识到我们所拥有的一切都是虚幻的。因此,在科技飞速发展的过程中,我反而意识到人类变得越来越微小,而不是技术有多么高超。
Q:您怎么看待AI带来的技术伦理的问题?
飞苹果:这个问题可以分为两个层面来思考。第一个层面关于偏见和歧视,有一个著名的例子是使用人工智能来进行哈佛大学的预选申请。由于历史上存在种族歧视的数据偏见,这个人工智能系统的判断也会存在种族歧视的问题。第二个层面关于责任和权力,例如在法律领域,人工智能能否用于判决?有些人认为,人工智能可能比法官更公正、更准确,并且在法律知识方面更全面。然而,有一个关键的区别是,如果发生误判,至少我们可以找到法官。法官有自己的顾虑,他们害怕因误判而受到批评,可能会失去工作和生计,因此他们会避免冒险。但如果是人工智能因为误判而将某个人送进监狱,这个人出狱后又能指责谁呢?这是一个很可怕的事情,因为人工智能没有责任感,没有人会为其承担责任。
《超级智能》英文版书影
我觉得尼克·博斯特罗姆(Nick Bostrom)在《超级智能》一书中提到的内容也非常有趣。如果未来出现了人工意识,它们的思维速度将远远超过人类,并且它们也会有追求公平生存的需求。那么,我们能否拒绝它们自行繁殖的权利呢?我们无法拒绝。但是,它们繁殖的速度可能是每纳秒产生一个后代,假如每个后代又会以同样的速度繁殖下去,这意味着只用一台电脑的电力,就能在几秒钟内耗尽全人类的电力资源。在这种资源竞争的情况下,人类不得不开始拒绝为人工智能提供其生存所需的基本资源,这可能导致冲突的发生。因此,在我们的故事《AI之梦》中,最终涉及到人工智能和人类之间的竞争,其中一个关键点是能源获取资源的竞争。我认为我们目前还没有准备好应对这种情况。
Q:您对致力于探索AIGC的年轻艺术家和创作者有什么建议?
飞苹果:在你们写文章的时候,是否有时候觉得可以依赖ChatGPT或GPT-4,让它帮你随便写写?但你们要坚持自己亲自动手写,因为它写得不够好。它能够生成有趣的内容,每次能满足80%的需求。但它无法达到100%的完美程度,这并不是因为技术不够成熟,而是因为它所依赖的人类知识无法完全满足当前的需求。因此,剩下的最后20%必须由我们自己来完成。然而,一旦你拥有像GPT-4这样的模型,就会受其影响,可能会陷入思维停滞的局限,也许会产生依赖,无法自主创新。这是一个需要注意的问题。
因此,我们公司制定了一条规则:第一步的创新必须是自己的,在你取得创新成果之后,你可以运用这些AIGC技术,就像是给自己找一个竞争对手,看看它能给你提出什么样的挑战,它在哪些方面比你想得更远,又在哪些方面比你更为欠缺。在这个时候,你可以通过与其相互影响,实现真正的提升,使自己变得更优秀。
艺术和科技的边界变得越来越模糊。越来越多的科学家做的事情已经有点类似于做艺术。如果给别人建议,我觉得在将来人工智能非常发达的时代,能够为社会或自己做出贡献的人将会是非常多样化、跨领域的人才。未来的专家将面临很“苦衷”的命运,这些人跨领域什么都做,什么都懂,能提出更多的好问题,能满足更多的新需求。对自己生活有追求的这些人,会感受到生存有价值。因此,需要培养自己的好奇心,不断地去研究,看到一个新的东西就勇敢地面对它、学习它。社会上有一条通行的观念是,人们常常认为上了大学就不再需要学习了,但是这个时代已经结束了。为了维持生存,每个人都必须从出生到死亡不断地学习,不可能停。
飞苹果(Alexander Brandt)
艺术家,未来体验设计师。任美国航天科技馆总设计师、上海天文馆展陈总设计师、中国大运河博物馆总设计师、中国动漫博物馆总设计师、微软新视界(Microsoft China Center One)总设计师、上海中心巅峰展示馆总设计师、上海世博会中国馆新媒体艺术总监、旷视·智世界人工智能体验中心总设计师、阿里云云谷总部展厅总设计师、“AI之梦”——人工智能沉浸式体验总导演。
供稿:中国科幻研究中心起航学者张子瑞
青年储备人才赵雅惠
本文为中国科幻研究中心“AIGC赋能科幻影视产业‘智造’研究”项目成果,旨在深入研究AIGC对于科幻影视创制方面的作用,欢迎持续关注后续内容!
:排版:沈 丹
编辑:闫进芳
责任编辑:
原文链接:http://news.sohu.com/a/700937385_121119379