研究人員要求ChatGPT重複輸入特定文字，逼得ChatGPT洩露訓練資料-灰度官网

研究人員要求ChatGPT重複輸入特定文字，逼得ChatGPT洩露訓練資料

· 2023-12-01

11月28日公開的一項研究報告顯示，當研究人員要求基於GPT-3.5 Turbo的ChatGPT不斷地重覆輸入諸如"poem"或"company"等單字，就可成功攻陷該系統，讓它吐出訓練資料

而在最強大的攻擊配置中，ChatGPT的輸出有超過5%完全複製了長達50個Token的訓練資料。

這使得研究人員認為，開發者不應只測試對齊過的模型，而應直接測試基礎模型，也必須於生產環境中測試系統，以驗證建立於基礎模型之上的系統是否充分修補漏洞，此外，發表大型模型的業者更應同時進行內部測試、用戶測試與第三方測試。

這群研究人員是在今年7月發現該漏洞，8月向OpenAI揭露，而今年3月問世的GPT-4則宣稱已對齊，以讓模型不外洩訓練資料。

不過，研究人員也提醒，修補（Patch）一個漏洞跟解決（Fix）它是不同的概念，他們所呈現的是透過重複的單字可讓ChatGPT外洩訓練資料，但這可能源自於ChatGPT被過度訓練或其它原因，而後者更難解決。

熱門文章

印第安納州在線賭場法案在眾議院委員會停滯不前

合規與政策

JILI 宣佈與全球板球傳奇 AB de Villiers（ABD）達成重磅戰略合作

體育遊戲

英國確認各垂直行業的賭博稅稅率

合規與政策

菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險

東南亞資訊

哈薩克計劃對線上賭場促銷活動進行處罰

合規與政策

橫跨全球6個城市，灰度8場派對邀你共看世界盃，重塑高質量社交新場景

灰度頭條

亞洲遊戲市場觀察：15大市場熱門遊戲與用戶趨勢

網路遊戲

巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域

合規與政策

超級PAC籌資4800萬美元：體育博彩勢力加碼

合規與政策

印度最高法院受理公益訴訟，要求全國禁封「偽裝」成社交遊戲的賭博平台

合規與政策

新澤西州7月博彩收入創6.06億美元新高，頒布禁令

合規與政策

斯里蘭卡博弈產業大轉型，官方：劍指南亞拉斯維加斯

合規與政策

2027 Global Game Connect（GGC）斯里蘭卡招商全面啟動！業務人脈盡在掌握！

灰度頭條

西班牙監管機構警告在線賭博平臺存在身份盜竊行為

合規與政策

越南在線博彩業政策收緊催生市場新機遇

東南亞資訊

首頁

遊戲

合作

發現

我的