研究人員要求ChatGPT重複輸入特定文字,逼得ChatGPT洩露訓練資料
· 2023-12-01

11月28日公開的一項研究報告顯示,當研究人員要求基於GPT-3.5 Turbo的ChatGPT不斷地重覆輸入諸如"poem"或"company"等單字,就可成功攻陷該系統,讓它吐出訓練資料

而在最強大的攻擊配置中,ChatGPT的輸出有超過5%完全複製了長達50個Token的訓練資料。

這使得研究人員認為,開發者不應只測試對齊過的模型,而應直接測試基礎模型,也必須於生產環境中測試系統,以驗證建立於基礎模型之上的系統是否充分修補漏洞,此外,發表大型模型的業者更應同時進行內部測試、用戶測試與第三方測試。

這群研究人員是在今年7月發現該漏洞,8月向OpenAI揭露,而今年3月問世的GPT-4則宣稱已對齊,以讓模型不外洩訓練資料。

不過,研究人員也提醒,修補(Patch)一個漏洞跟解決(Fix)它是不同的概念,他們所呈現的是透過重複的單字可讓ChatGPT外洩訓練資料,但這可能源自於ChatGPT被過度訓練或其它原因,而後者更難解決。

热门文章
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
英国确认各垂直行业的赌博税税率
游戏风向
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
密西西比州众议院委员会推进提议增加赌场税的法案
游戏风向
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
越南在线博彩业政策收紧 催生市场新机遇
东南亚资讯
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
首页
游戏
合作
发现
我的