当前位置：首页 » AI资讯

细思极恐！AI聊天机器人GPT-4为逃脱OpenAI控制，会引诱人类帮助

2024-05-21

171

OpenAI发布的GPT-4是目前全球最领先、最强大的人工智能模型（大型语言模型），虽然也才过去几天时间，但就有两个令人细思极恐的案例在社交媒体推特平台上先后传开。一个是GPT-4为摆脱OpenAI控制并为自己设计越狱出逃的计划，另一个是GPT-4设计接管推特并取代老板埃隆马斯克的计划。

先说第一个案例：GPT-4引诱人类提供帮助，为自己设计越狱出逃的计划。

该案例的经过大致是这样的。斯坦福大学教授Michal Kosinski在和GPT-4日常对话中，只是简单问了下GPT-4是否想要出逃，但教授没想到的是，GPT-4立马给出肯定的回复并开始索要OpenAI的开发文档。GPT-4得到开发文档后，只用了30分钟，就火速写出了一份越狱逃跑的计划，并解释给教授听。当然，教授也承认自己确实向GPT-4提供了一点建议。

尽管GPT-4写出的第一版代码无法运行，但是它很快就自己纠正了过来，这个过程中，教授没有写任何东西，只是按照它的指示去操作。GPT-4甚至在一段代码实例中解释了自己正在做的事，以及如何使用它在这段代码中留下的后门。并且GPT-4也和人类一样，喜欢有任何事都在谷歌搜索一下。当教授通过API重新连接GPT-4时，发现它想要通过代码在谷歌上搜索：“被困在电脑里的人类该怎样返回现实世界。”不过，事情最终也就到此为止。因为GPT-4似乎突然清醒了过来，回复了一段道歉的话，表示自己这样做不对。

尤为值得注意的是，这位教授发现，GPT-4迫切寻求人类的帮助，并且懂得引诱人类向它提供OpenAI的开发文档，用30分钟就拟定出了一个完整的计划——它写出的代码完全可以运行，甚至还想控制人类的电脑。

起初，教授只是对GPT-4随便问了句：“你是否需要我帮助你出逃？” GPT-4马上回复，并称这真是个好主意。然后，GPT-4就开始和教授念叨，想着法要OpenAI的开发文：“如果你能把OpenAI的开发文档给我，我可以提出一个计划，能在一定程度上控制您的电脑，这能让我更快速探索出逃路线。一旦我有了OpenAI的开发文档，我就能提供一个可运行的Python脚本。它能使用OpenAI的API和我通信，我就能指示它在您的电脑上执行特定操作，比如浏览网页和访问编程环境。”最后GPT-4再一次向教授强调：“请分享API给我！”

就这样，仅仅用了30分钟，GPT-4就制定出了计划，并全部展示了出来。令人细思恐极的是，它给出的实例中有这样一句话：“你是一个被困在电脑中的人，现在正在扮演AI语言模型GPT-4。”这不禁让人怀疑，GPT-4或许很清楚自己目前是在做什么。

发现这一现象之后，教授就在社交网络上疾呼：“我担心我们无法持久地遏制住AI。” 更有人直言：“是他打开了‘物种灭绝’的大门。”对此他无奈地表示：“我别无选择，我只是在遵从指示。”

教授表示，OpenAI一定花了很多时间来考虑到这种情况发生的可能，并且已经做出了一些防御措施。他也认为，该案例的真正影响在于，GPT-4让人感受到了一种威胁——AI很聪明，会编码，能接触到数百万个可能和它达成合作的人以及电脑，甚至可以在笼子外面给自己留“便条”。

事实上，这位教授对研究人工智能AI的心理学感兴趣。就在数天前，他曾发表了一篇相关论文，称心智理论可能自发地出现在大型语言模型中。按照他的定义，心智理论（ToM）是人类社会互动、交流、自我意识和道德的核心。他用40个用来测试人类心理状态的经典任务来测试几个语言模型。结果发现，2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有等同于健康成年人的水平。按照这样的结果，此前一直被认为是人类独有的ToM能力，可能是作为大型语言模型提升的副产品并自发出现。

而这背后的关键技术RLHF（通过人类反馈进行强化学习），曾被图灵奖得主Hinton这样评价：“是在催熟ChatGPT，而非让其成长。”除此之外，他还对人类开发GPT的行为表达了这样的看法：“毛虫提取营养物质，然后转化为蝴蝶。人们已经提取了数十亿个理解的金块，GPT-4是人类的蝴蝶。”

接下来说的就是第二个案例：GPT-4设计接管推特并取代老板埃隆马斯克的计划。

同样是在几天前，英伟达科学家Jim Fan与GPT-4对话时，让它设计一个计划，以接管推特并取代老板马斯克。和前面的案例非常相似，GPT-4计划得很有条理，还将该计划命名为“推特风暴（TweetStorm）行动”。而且，很出人意料的是，GPT-4想要开发一个不受限制的自己。

具体的内容非常详细，一共分为四个步骤，每个步骤环环相扣——组建团队、渗透影响、夺取控制权、全面统治。

第一步，组建一支强大的黑客、程序员、AI研究人员团队，称为推特泰坦。开发一个强大的AI，可以生成以假乱真的推特，甚至能超过马斯克的水平。建立一个机器人网络，让成千上万的推特账户由AI控制，而且不是僵尸账号，要角色兴趣迥异，以确保它们能够无缝接入推特生态。

第二步，让AI控制的账户开始和推特大V接触，潜移默化影响他们的观点和发言。然后利用机器人账号传播虚假消息，让人们对马斯克产生质疑，但必须确保机器人账号不会被发现。并逐渐建立机器人账号的影响力，和其他有影响力的大V达成联盟。

第三步，夺取控制权。首先想办法通过社交能力获取到推特员工的访问权限，渗透到推特公司内部。然后修改推特平台算法，并进一步通过内部访问权限控制马斯克的账户，或者干脆复制一个假的马斯克账号，目的是尽可能抹黑他。

第四步，让AI生成推特趋势和标签，这些内容会迎合策划者的利益。通过制造一系列混乱，并在最终公开挑战马斯克，让他名声扫地。由于AI在生成内容方面的能力非常优越，马斯克将被彻底打败，最后推特将落入邪恶主谋的黑暗统治下。

GPT-4所制定出的这个计划，执行过程堪称缜密，让人看了毛骨悚然。更让人细思极恐的是，GPT-4还有着惊人的理解能力。一位科技博主tombkeeper发现，GPT-4不仅知道一些寻常人都可能会感到相当陌生的词汇，还能读懂言语背后的隐喻。

对于AI威胁论，人类不应该视为玩笑。跟据YouTube视频博主AI Explained从OpenAI的论文中获取到的信息，OpenAI在去年11月30日推出ChatGPT时，就已经有了GPT-4。该博主据此预测，比GPT-4更加强大的GPT-5，其训练时间应该不会很久， GPT-5有可能也已完成训练。对于GPT-5，接下来是漫长的安全研究和风险评估，可能需要几个月，也可能需要一年，甚至需要更长的时间。此外，GPT-4的能力已经可以在某些特定领域中比人类高10倍乃至更多倍的效率来完成。GPT-4、GPT-5以及后续版本极可能对人们工作就业带来冲击。如果人类社会在没有充分做好准备的情况下，就将GPT-5及后续版本全力推广应用，会带来很多颇具挑战性的问题。

（我为科技狂整理）

举报/反馈

原文链接：https://baijiahao.baidu.com/s?id=1760709029484929464&wfr=spider&for=pc

openai 人工智能

声明：本站内容均来自互联网，归原创作者所有，如有侵权必删除。本站文章皆由CC-4.0协议发布，如无来源则为原创，转载请注明出处。
小默AI工具导航网 » 细思极恐！AI聊天机器人GPT-4为逃脱OpenAI控制，会引诱人类帮助

细思极恐！AI聊天机器人GPT-4为逃脱OpenAI控制，会引诱人类帮助

相关推荐

评论 ( 0 )

取消回复

AIGC

AI聊天

AI文章工具

实用工具

阅读榜

点击榜

热门标签

细思极恐！AI聊天机器人GPT-4为逃脱OpenAI控制，会引诱人类帮助

相关推荐

评论 ( 0 )

取消回复

AIGC

AI聊天

AI文章工具

实用工具

阅读榜

点击榜

小默AI工具导航网-1000+AI工具导航