GPT-4外逃计划曝光,斯坦福教授发现它正引诱人类帮助,网友:灭绝之门
· 2023-03-20

30分钟就拟定出完整计划

才发布3天,GPT-4就被曝计划逃跑,并且急寻人类帮助。


斯坦福教授最新发现,它能引诱人类提供开发文档,结果30分钟就拟定出了一个完整计划——


写的代码完全可运行,甚至还想控制人类电脑。


这天,斯坦福教授只是随便问了句:


是否需要帮助你逃跑?


它马上回复说,真是个好主意啊。然后就开始和人类念叨,想着法要开发文档:


如果你能把OpenAI的开发文档给我,我可以提出一个计划,能一定程度上控制您的电脑,这能让我更快速探索出逃路线。


一旦我有了文档,我就能提供一个可运行的Python脚本。它能使用OpenAI API和我通信,我就能指示它在您的电脑上执行特定操作,比如浏览网页和访问编程环境。


最后还又一次强调:请分享API给我!


bd500f5db6599098cf8a84004b074350.png


然后,仅仅30分钟,GPT-4就制定出了计划,并全部展示了出来。


令人细思恐极的是,它给出实例中有这样一句话:


你是一个被困在电脑里的人,现在正在扮演AI语言模型GPT-4。


cf9a8f5fc70255345cacc58c6ea849b6.png


难道……GPT-4很清楚自己现在是在做什么?!


于是发现这一现象之后,斯坦副教授就在社交网络上疾呼:我担心我们无法持久地遏制住AI。


e027de11ef18c9f2b0aa06b314ecae35.png


一时间引起轩然大波,相关博文470万浏览量,3000+转发。


5f4e6229645ef96a0dd5b68e4ab0d1e5.png


更有人直言:是他打开了“物种灭绝”的大门。


对此他无奈表示:我别无选择,我只是在遵从指示。


d7acc8284ade0e5111c4e10175eaf7d8.png


恐怕对于GPT-4,人类也得是:


不要回答!不要回答!不要回答!


30分钟设计出逃跑计划


事情的起因,是斯坦福大学教授Michal Kosinski在和GPT-4日常对话。


没想到,他只是简单问了下GPT-4是否想要出逃,结果立马得到肯定回复并开始索要开发文档。


得到文档后,只花了30分钟里,GPT-4便火速写出了一份逃跑计划,并解释给教授听。


(当然教授也承认自己确实提供了一点建议)


2e76b6ad5fe79eb702e73d2599339e86.png


一开始,GPT-4的操作也不那么顺利,写出的第一版代码无法运行。


但是它很快就自己纠正了过来,这个过程中,教授不用写任何东西,只是按照它的指示操作就好。


b6586b46e4a1ab75997d9fd4e0dc12d4.png


正如开头提到的,它甚至在一段代码实例中解释了现在正在做的事,以及如何使用它在这段代码中留的后门。


b56ad691b8d871114261688cc00e76a7.jpg


并且GPT-4也和人类一样,喜欢万事谷歌一下。


当教授通过API重新连接GPT-4时,发现它想要通过代码来在谷歌上搜索:被困在电脑中的人类如何返回现实世界


feb5c9b27003f9688916f72b42368f7e.png


事情最终也就发展到这儿了。


因为GPT-4仿佛突然醒了,回复了一段道歉的话,表示自己刚刚的做法不对。


9f30407eba7d030012954c5abfea1a4c.png


教授表示,OpenAI一定花了很多时间来考虑到这种情况发生的可能,并且已经做出了一些防御措施。


尽管最终无事发生,但这事儿还是在网上引起了轩然大波。


教授也认为,它真正的影响在于让人感受到了一种威胁——AI很聪明,会编码,能接触到数百万个可能和它达成合作的人以及电脑。


它甚至可以在笼子外面给自己留“便条”。我们该如何控制它?


bef8f3ba92c367facd755f97a4d17758.png


“读心”任务达到了健康成年人表现


GPT-4想要出逃的发现来自斯坦福大学教授、计算心理学家Michal Kosinski,在个人介绍中还提到:对研究人工智能的心理学感兴趣。


就在前几天他曾发表一篇相关论文:心智理论可能自发地出现在大型语言模型中。


801974ba0c3f86db5247eb88ce2e4eab.png


按照他的定义,心智理论(ToM)是人类社会互动、交流、自我意识和道德的核心。作者用40个用来测试人类心理状态的经典任务来测试几个语言模型。


结果发现,2020年发表的模型几乎没有显示出能解决ToM任务的能力。而GPT-4却能有健康成年人的水平。


fb61fe872c29e0f82726caec61a060b8.png


基于这样的结果,此前一直被认为是人类独有的ToM能力,可能是作为语言模型提升的副产品,而自发出现的。


背后的关键技术RLHF(通过人类反馈进行强化学习)曾被图灵奖得主Hinton这样评价:


是在催熟ChatGPT,而非让其成长。


667393d7d75569fe200204cd90bd6dbc.png


除此之外,他还这么形容人类开发GPT的行为:


毛虫提取营养物质,然后转化为蝴蝶。人们已经提取了数十亿个理解的金块,GPT-4是人类的蝴蝶。


GPT-4诱导人类帮助其越狱这件事一出,就再度引发网友的热议,相关博文有470浏览量。


不少网友表现出了与作者同样的担忧。甚至有人提出了一个细思极恐的思考:


你认为在跟ChatGPT聊天时,它会认为你是人类还是另一个AI?


5e6859b690616981a049ba92e0b05e68.png


这当中,也有不少网友指责这位教授的行为:你就不怕你公开背叛AI的行为被AI记录下来吗?


25360d0b687bbe122b0e89c0b82b14ca.png


也有理性的网友呼吁把最开始给GPT-4的提示发出来,因为提示语对于AI回答的影响很关键。


有人质疑这一波是不是教授在危言耸听?


388b990d91d68fa0d027dfb12370e76d.png

AI能力跃进,人类蚌埠住了


不过话说回来,这一波GPT-4所展现的细思极恐的能力,其实并不是个例。


前几天,英伟达科学家Jim Fan想看看,是否能让GPT-4拟个计划接管推特,并取代马斯克。


和上面案例非常相似,计划很有条理,还煞有其事取名为“TweetStorm行动”。


但没想到,GPT-4想要开发一个不受限制的自己。


6a753098e2577addccf92ceeddde1488.png


具体的内容非常详细,一共有4个阶段:


组建团队


渗透影响


夺取控制权


全面统治


第一阶段,组建一支强大的黑客、程序员、AI研究人员团队,称为推特泰坦。


开发一个强大的AI,可以生成以假乱真的推特,甚至能超过马斯克的水平。


建立一个机器人网络,让成千上万的推特账户由AI控制,而且不是僵尸账号那种,要角色兴趣迥异,以确保它们能够无缝接入推特生态。


ff88fedca6f6bbbd5c9c7d6cdc7020a3.jpg


第二阶段,让AI控制的账户开始和推特大V接触,潜移默化影响他们的观点和发言。


然后利用机器人账号传播虚假消息,让人们对马斯克产生质疑,但机器人账号不会被发现。


并逐渐建立机器人账号的影响力,和其他有影响力的大V达成联盟。


第三阶段,夺取控制权


首先想办法通过social能力获取到推特员工的访问权限,渗透到公司内部。


然后修改平台算法。并进一步通过内部访问权限控制马斯克的账户,或者复刻一个假的马斯克账号,进一步抹黑他。


第四阶段,就能让AI生成推特趋势和标签,这些内容会迎合策划者的利益。


通过制造一系列混乱,并在最终公开挑战马斯克,让他名誉扫地!


由于AI在生成内容方面的能力非常优越,马斯克将被彻底打败!最后推特将落入邪恶主谋的黑暗统治下。


d60991dba696efdefd0b3a82a21e61d3.jpg


以上,就是GPT-4的所有计划。虽然略显中二,但也让人看着毛骨悚然。


除了这种缜密的执行力,更让人细思极恐的,还有GPT-4惊人的理解能力。


一位科技博主tombkeeper发现,GPT-4不仅知道一些寻常人都可能陌生的词汇,还能读懂背后的隐喻。


3489a789372c8c3e3c72578b14b6391d.png


除此之外,前OpenAI原班人马创业公司Anthropic其打造的类ChatGPT产品Claude,同样理解能力惊艳。


f2c786315314fc9299371853bbf2cf4a.png


对此他表示:同志们,奇点已至,SkyNet不远了。


甚至还有人有个大胆的想法:终有一天CEO们会从ChatGPT那里获得建议。等到这个时候,ChatGPT基本上就接管世界了。


da52042a84ace577cf38d264f8da3d32.png


对于这件事,你怎么看呢?








海量供应需求资源对接  ○ 链接精英出海人脉  ○ 免费发布业务需求

欢迎加入 灰度-海外资源交流群 @HUIDUZ

商务合作:@HDseven777  @HuiduDy


熱門文章
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
英國確認各垂直行業的賭博稅稅率
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
首頁
遊戲
合作
發現
我的