编者按:ArgoDesign 是一家兼顾设计、产品和咨询一体的跨国设计咨询机构,他们的客户涵盖了包括 IBM、亚马逊、梦工厂和山姆在内的世界知名企业,而这篇文章出自 ArgoDesign 的首席设计师 Guus Baggermans。
作为一个大型设计机构的首席设计师,Guus 如今的工作内容是探索 AI 和设计产品、服务的结合,在负责设计的同时,要探索新技术在产品和服务的应用。通过一系列的测试和体验,Guus 在这篇文章中,非常冷静地阐述了他对于 AI 的看法,优点劣势和设计师应对 AI 的姿态,并针对如何创建包含 AI 的产品,提供了有效的建议。
以下是正文:
从今年年初开始,咱们就一直在被人工智能的新闻刷屏,你打开新闻网站和社交媒体,是一定会看到大量关于 ChatGPT、Stable Diffusion、Midjourney 和 OpenAI 相关的文章。
尽管人工智能从 1950 年以来就已经存在,但是最新的人工智能算法将 AI 推到了时代的最前沿。第一台计算机擅长完成重复性的任务,但是需要人借助编程语言和它进行沟通。随着时间的推移,我们开发出了越来越复杂的语言和界面,鼠标、触摸屏和 VUI 都是这个过程中诞生的成果,这使得非程序员也能使用计算机。
如今,AI 成为了一个特定的分支,被称为 Transformers 的 AI 算法架构塑造了 ChatGPT 这样的工具,类似的 AI 工具也开始在每天的新闻当中铺天盖地地呈现出来。许多基于生成式 AI 的在线工具涌现,而它们的设计却大都显得原始而不够完善。
生成式 AI 呈现了不少强大的新功能,这些功能之前之所以无法想象是因为成本太过于高昂,以至于仅仅只出现在某些概念设计中。然而在生成式 AI 的帮助下,它们得以呈现。现在 AI 可以帮助用户进行创造性地创作,在非结构化的数据中发掘信息,回答用户复杂的问题,为每个用户提供真正个性化的体验,甚至可以代表你和他人沟通。 ArgoDesign 也举办了一场精彩的网络研讨会,探讨生成式 AI 对于未来企业的意义。
我习惯于通过深入实践学习,在学习中理解新概念,塑造能力。在我的工作中,我们将其称之为「边创作边思考」。为了更好地使用 AI,我们举办了内部竞赛,使用生成式 AI 制作电影海报。通过这次练习,我们了解了生成式 AI 的优势和劣势,而这些经验也被我们视作为设计的素材。
我们使用使用 ChatGPT 等工具来创建电影的名称、剧本甚至影评,然后使用 Midjourney 和 Stable Diffusion 来生成相关的视觉图像。
通过有趣但足够专业的比赛,来验证工具的可用性,了解其中的差异,我们也逐渐了解到这些工具的运作原理,各自擅长的方面,当然,最重要的还是这些工具所不擅长的是什么。通过这些评估,我们确定,生成式 AI 可以产出可以用来设计的素材。
这对于设计师意味着什么?
首先,我要做一个简短的声明,文章后续的部分都是建立在这个声明的基础上的。目前,AI 经常会给出我们错误的答案,而且在许多情形下,输出的质量是存疑的。关于 AI 生成的内容在知识产权归属上,即使是法律本身也没有做到完全明确定义,相关的议题依然处于广泛的争论当中,对于 AI 生成的素材对于当今社会的影响无疑是巨大的,并且其中还存在许多伦理道德层面的问题。
和任何新技术一样,AI 生成用户体验的最佳实践还有待定义。接下来,我们将继续探讨几个成熟的议题。
AIGC 的技术确实是新鲜事物,绝大多数人其实还不明白它能做什么,只是感知上确实感觉有无穷的可能性。总结文本主题,重写内容,在数据中寻找重复的模式,甚至创建一个不存在的小狗的插画,让它戴着棒球帽,踩着滑板。
ChatGPT 能做很多令人难以置信的事情,但是 OpenAI 并没有提供功能文档,所以是有必要帮助用户来先发觉这些功能,并且让用户了解它们,并且快速访问重要的功能和内容。这就是为什么像 Github 这样得网站上,供用户学习各种 Prompt 得内容会爆炸性地增长。本质上,用户们正在为 OpenAI 编写文档,并且互相分享。
Midjourney 生成的图片素材更有用,最重要的是 Midjourney 在它的服务当中内嵌了分享功能,用户每生成一套图片,这些图片就会被添加到一个目录当中,用户可以通过这个目录查看生成的图片素材,以及相应的 Prompt,这样一来,用户可以互相学习,无需从头开始。
Google 则更进了一步,在 Google Workspace 中,将文本的编辑简化为几种易于访问的按钮,这种方式降低了用户编写 Prompt 的复杂操作,用户无需使用「请为我总结这段文字」而是直接点击「Shorten」按钮即可实现功能。
要点:如果你正在设计 AI 相关的产品,那么一定要向用户介绍甚至演示你们做了什么,让用户知道、了解你的 AI 产品的功能,并帮助用户更好使用它们。
生成式 AI 可以在短时间内创建大量的内容,以 15 种不同的方式重现编写同一个段落很容易,生成一张图片的 30 个变体也很容易,但是如何帮助用户选择最好、最合适的变体呢?那么在以信息流作为主要成呈现形态的界面当中,如何让更好的那一个从中脱颖而出呢?
ChatGPT 会为不同的对话自动命名
ChatGPT 的聊天式界面风格让你可以和 AI 进行「多轮对话」,而已经完成的对话,ChatGPT 会对它的内容进行命名,这些命名能够帮你更快定位。尽管这种方式很酷,但是依然有缺陷,如果你的目标是希望 AI 帮你重写文章的话,那么这个对话当中,你会看到长篇大论的内容,量非常大,那么这种聊天界面可能并不是最理想的载体。
Midjourney 其实也存在类似的问题,它唯一的交互界面是借由 Disord 而存在,用户必须将聊天机器人加入到自己的服务器之后,才能在 Discord 中发送 Prompt ,然后 AI 才能在其中做出响应,生成你要的图片。
幸运的是,呈现多个项目的合集,并不是个新的 UI 设计的问题,你可以在 Adobe Lightroom 中找到一个颇为值得借鉴的案例。Adobe 在管理大型摄影项目的时候,有个不错的归档界面,它内置了一套机制,可以帮你更好的过滤、排序、评级、对比不同的照片,如果你需要为你的 AI 产品创建生成内容对比的界面,可以参考这种设计思路。
要点:如果你的 AI 应用可以低成本生成大量内容,那么它也要具备帮助用户管理和跟踪各种变体的功能。
生成式 AI 擅长输出内容,但是并不擅长呈现输出内容背后的逻辑和原理。当你要求生成式 AI 回答问题的时候,它能给你一个相对完备且信心十足的答案,即使这个答案可能完全是幻觉,甚至并非基于现实。这种错误或者虚幻的结果是现在 AI 生成的副产物,很难预防。那么在设计 AI 类的工具的时候,我们要如何应对呢?
下面的案例来自 Google 的 Bard LLM,这 Bard 针对用户提出的问题给予了一个回答。用户的问题是每年12月当中,除了1月和2月之外,还有哪些月份,而 Bard 的回答则将 12 个月又重新罗列了一遍,这是一个显而易见的逻辑错误。Bard 并没有给出答案的出处或者生成的缘由,这也使得错误仅仅只是一个错误,而这个答案在这个地方似乎也没有后续探究、改进的可能。
而一个显而易见的解决方法,就是 LLM 模型将自己获取信息的来源罗列出来,方便用户根据这些来源来验证 AI 所给出的答案。而微软的 New Bing 在这一点上则做的好很多,在 Bing 给出的答案的底部,都能看到这些答案的来源,用户可以点击来源链接深入挖掘答案所涉及的页面。
另外,可以从这些来源当中提取另外一个数据,就是「可信度评分」,许多机器学习的算法会对 AI 所提供的答案进行评分,下面是 OpenAI 的 Whisper 的截图,这是一种可以将音频内容转录为文本的工具,而它重要的特性在于,它会将所转录出的结果的「可信度评分」直接使用可视化的色彩标识出来,用户可以直观地看到那些内容准确度可信度更高,可以将低可信度的内容排除在外。
要点:在创建 AI 生成工具或者使用 AI 生成内容的时候,请确保为用户提供工具来验证生成的结果和答案。 AI 并不总是正确的,你的用户理应知道答案是从哪里来的。
权利越大,相应的法律责任和道德责任就越大!在将生成式 AI 应用到你的程序或者服务中之前,请认真考虑下列问题:
-
你所使用的 AI 算法是否存在偏差?
数据集通常是存在偏差的。当你让 Midjourney 生成专业人士的图片时,它确实更偏爱生成男性为主体的图像。我们还能在数据集中找到很多类似的问题。
-
你是否正在处理敏感或者私人的信息?
绝大多数的生成式 AI 都是透过 API 在云服务中运行的。从本质上来说,你如果想要使用这些 AI 服务,就意味着你需要将你的信息发送到另外一个公司的网络服务器上,在这些情况下,你最好检查一下你发送的内容和数据是否敏感,以及你的用户是否清楚你并非他们数据唯一的接受方(三星员工曾经为了获得答案在 ChatGPT 中上传了公司的敏感资料)。
以ChatGPT 为例,他们的隐私政策明确地规定(2023年3月14日更新),他们可以使用用户所提供的个人数据来作为 ChatGPT 的训练数据,而这种和欧洲隐私法(GDPR)相冲突,并且这直接导致意大利直接禁止使用 ChatGPT。
无论如何,当你想要在产品当中使用 AI 服务的时候,请务必检查隐私政策,查看它们是否符合当地的法律法规。
-
生成的内容知识产权对你的 APP 重要吗?
现在关于生成式 AI 输出内容的知识产权归属的争论非常的激烈。现在相关的法律法规还不完善,但是根据现在已有不少相关的案件在进行中,这些案件的判决结果将会为后续法律法规的定调。
早期比较著名的案件是漫画 Zarya 的版权归属,在这个案件中,美国版权局认定不对 AI 生成的图像进行版权保护。
最近,美国版权局给出了一个更加细致的指南,指出如果内容仅仅是借助 Prompt 引导 AI 生成,且后续并没有进行调整和设计,那么它将不会获得版权保护。你可以沿着这个思路推导下去,下一个问题可能是,有多少人参与才算有效等等。我相信类似的争论还会持续很久。
要点:你需要问问自己「我是否站在用户这边?」,请记住,目前所有的情况一直在发生变化,并且持续相当长的一段时间。当你在向产品中添加 AI 的时候,请想清楚这一点,因为你可能之后要一直调整策略和状态。
最后记住3点
-
请记住,设计师应该专精设计,如今计算机可以生成以往设计师手工创建的事物,那么就让人工智能成为辅助你、驱动你走得更远的助力。
-
请记住,生而为人应该洞悉人性,电脑能够生成一堆东西,但是只有你能看出哪些更有价值,哪些东西对人更有意义,而不是反过来。
-
请记住,亲身尝试,在实践中思考!
原文链接:https://www.bilibili.com/read/cv23200836/