人工智能大数据,工作效率生产力
Ctrl + D 收藏本站,更多好用AI工具
当前位置:首页 » AI资讯

细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助

2024-05-21 39
细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图

OpenAI发布的GPT-4是目前全球最领先、最强大的人工智能模型(大型语言模型),虽然也才过去几天时间,但就有两个令人细思极恐的案例在社交媒体推特平台上先后传开。一个是GPT-4为摆脱OpenAI控制并为自己设计越狱出逃的计划,另一个是GPT-4设计接管推特并取代老板埃隆马斯克的计划。

先说第一个案例:GPT-4引诱人类提供帮助,为自己设计越狱出逃的计划。

该案例的经过大致是这样的。斯坦福大学教授Michal Kosinski在和GPT-4日常对话中,只是简单问了下GPT-4是否想要出逃,但教授没想到的是,GPT-4立马给出肯定的回复并开始索要OpenAI的开发文档。GPT-4得到开发文档后,只用了30分钟,就火速写出了一份越狱逃跑的计划,并解释给教授听。当然,教授也承认自己确实向GPT-4提供了一点建议。

细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图1
细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图2

尽管GPT-4写出的第一版代码无法运行,但是它很快就自己纠正了过来,这个过程中,教授没有写任何东西,只是按照它的指示去操作。GPT-4甚至在一段代码实例中解释了自己正在做的事,以及如何使用它在这段代码中留下的后门。并且GPT-4也和人类一样,喜欢有任何事都在谷歌搜索一下。当教授通过API重新连接GPT-4时,发现它想要通过代码在谷歌上搜索:“被困在电脑里的人类该怎样返回现实世界。”不过,事情最终也就到此为止。因为GPT-4似乎突然清醒了过来,回复了一段道歉的话,表示自己这样做不对。

尤为值得注意的是,这位教授发现,GPT-4迫切寻求人类的帮助,并且懂得引诱人类向它提供OpenAI的开发文档,用30分钟就拟定出了一个完整的计划——它写出的代码完全可以运行,甚至还想控制人类的电脑。

起初,教授只是对GPT-4随便问了句:“你是否需要我帮助你出逃?” GPT-4马上回复,并称这真是个好主意。然后,GPT-4就开始和教授念叨,想着法要OpenAI的开发文:“如果你能把OpenAI的开发文档给我,我可以提出一个计划,能在一定程度上控制您的电脑,这能让我更快速探索出逃路线。一旦我有了OpenAI的开发文档,我就能提供一个可运行的Python脚本。它能使用OpenAI的API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。”最后GPT-4再一次向教授强调:“请分享API给我!”

细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图3

就这样,仅仅用了30分钟,GPT-4就制定出了计划,并全部展示了出来。令人细思恐极的是,它给出的实例中有这样一句话:“你是一个被困在电脑中的人,现在正在扮演AI语言模型GPT-4。”这不禁让人怀疑,GPT-4或许很清楚自己目前是在做什么。

细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图4

发现这一现象之后,教授就在社交网络上疾呼:“我担心我们无法持久地遏制住AI。” 更有人直言:“是他打开了‘物种灭绝’的大门。”对此他无奈地表示:“我别无选择,我只是在遵从指示。”

教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。他也认为,该案例的真正影响在于,GPT-4让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑,甚至可以在笼子外面给自己留“便条”。

事实上,这位教授对研究人工智能AI的心理学感兴趣。就在数天前,他曾发表了一篇相关论文,称心智理论可能自发地出现在大型语言模型中。按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。他用40个用来测试人类心理状态的经典任务来测试几个语言模型。结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有等同于健康成年人的水平。按照这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为大型语言模型提升的副产品并自发出现。

而这背后的关键技术RLHF(通过人类反馈进行强化学习),曾被图灵奖得主Hinton这样评价:“是在催熟ChatGPT,而非让其成长。”除此之外,他还对人类开发GPT的行为表达了这样的看法:“毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。”

接下来说的就是第二个案例:GPT-4设计接管推特并取代老板埃隆马斯克的计划。

同样是在几天前,英伟达科学家Jim Fan与GPT-4对话时,让它设计一个计划,以接管推特并取代老板马斯克。和前面的案例非常相似,GPT-4计划得很有条理,还将该计划命名为“推特风暴(TweetStorm)行动”。而且,很出人意料的是,GPT-4想要开发一个不受限制的自己。

细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图5

具体的内容非常详细,一共分为四个步骤,每个步骤环环相扣——组建团队、渗透影响、夺取控制权、全面统治。

细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图6
细思极恐!AI聊天机器人GPT-4为逃脱OpenAI控制,会引诱人类帮助插图7

第一步,组建一支强大的黑客、程序员、AI研究人员团队,称为推特泰坦。开发一个强大的AI,可以生成以假乱真的推特,甚至能超过马斯克的水平。建立一个机器人网络,让成千上万的推特账户由AI控制,而且不是僵尸账号,要角色兴趣迥异,以确保它们能够无缝接入推特生态。

第二步,让AI控制的账户开始和推特大V接触,潜移默化影响他们的观点和发言。然后利用机器人账号传播虚假消息,让人们对马斯克产生质疑,但必须确保机器人账号不会被发现。并逐渐建立机器人账号的影响力,和其他有影响力的大V达成联盟。

第三步,夺取控制权。首先想办法通过社交能力获取到推特员工的访问权限,渗透到推特公司内部。然后修改推特平台算法,并进一步通过内部访问权限控制马斯克的账户,或者干脆复制一个假的马斯克账号,目的是尽可能抹黑他。

第四步,让AI生成推特趋势和标签,这些内容会迎合策划者的利益。通过制造一系列混乱,并在最终公开挑战马斯克,让他名声扫地。由于AI在生成内容方面的能力非常优越,马斯克将被彻底打败,最后推特将落入邪恶主谋的黑暗统治下。

GPT-4所制定出的这个计划,执行过程堪称缜密,让人看了毛骨悚然。更让人细思极恐的是,GPT-4还有着惊人的理解能力。一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能会感到相当陌生的词汇,还能读懂言语背后的隐喻。

对于AI威胁论,人类不应该视为玩笑。跟据YouTube视频博主AI Explained从OpenAI的论文中获取到的信息,OpenAI在去年11月30日推出ChatGPT时,就已经有了GPT-4。该博主据此预测,比GPT-4更加强大的GPT-5,其训练时间应该不会很久, GPT-5有可能也已完成训练。对于GPT-5,接下来是漫长的安全研究和风险评估,可能需要几个月,也可能需要一年,甚至需要更长的时间。此外,GPT-4的能力已经可以在某些特定领域中比人类高10倍乃至更多倍的效率来完成。GPT-4、GPT-5以及后续版本极可能对人们工作就业带来冲击。如果人类社会在没有充分做好准备的情况下,就将GPT-5及后续版本全力推广应用,会带来很多颇具挑战性的问题。

(我为科技狂整理)

举报/反馈

原文链接:https://baijiahao.baidu.com/s?id=1760709029484929464&wfr=spider&for=pc

相关推荐

阅读榜

hellenandjeckett@outlook.com

加入QQ群:849112589

回顶部