研究人員要求ChatGPT重複輸入特定文字,逼得ChatGPT洩露訓練資料
· 2023-12-01

11月28日公開的一項研究報告顯示,當研究人員要求基於GPT-3.5 Turbo的ChatGPT不斷地重覆輸入諸如"poem"或"company"等單字,就可成功攻陷該系統,讓它吐出訓練資料

而在最強大的攻擊配置中,ChatGPT的輸出有超過5%完全複製了長達50個Token的訓練資料。

這使得研究人員認為,開發者不應只測試對齊過的模型,而應直接測試基礎模型,也必須於生產環境中測試系統,以驗證建立於基礎模型之上的系統是否充分修補漏洞,此外,發表大型模型的業者更應同時進行內部測試、用戶測試與第三方測試。

這群研究人員是在今年7月發現該漏洞,8月向OpenAI揭露,而今年3月問世的GPT-4則宣稱已對齊,以讓模型不外洩訓練資料。

不過,研究人員也提醒,修補(Patch)一個漏洞跟解決(Fix)它是不同的概念,他們所呈現的是透過重複的單字可讓ChatGPT外洩訓練資料,但這可能源自於ChatGPT被過度訓練或其它原因,而後者更難解決。

熱門文章
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
首頁
遊戲
合作
發現
我的