Google應用社會學習,讓模型間不需交換原始資料就可轉移知識
· 2024-03-11

Google研究人員參考人類的學習方式,提出社會學習框架,使語言模型可以在保護隱私的同時,透過自然語言進行知識共享

Google公開了一項大型語言模型的創新研究,研究人員提出社會學習(Social Learning)框架,為模型間的知識傳遞開闢新途徑。社會學習使語言模型能夠透過自然語言文字交流知識,由於不需要直接交換敏感資料或是模型權重,因此能確保私密資料的隱私保護。

社會學習的概念就像是人類在社交環境與其他人交換知識的方法一樣,人類向其他人學習常見透過口頭指示,描述參與特定行為的方法,而Google研究人員受人類學習方式啟發,發展出了模型間的社會學習並制定了一個框架,使語言模型也能夠使用自然語言,並在考量隱私保護的情況下共享知識。

在社會學習框架中,學生大型語言模型會向多個已知特定任務解法的教師模型學習解決方案,研究人員透過評估學生模型在各種任務的表現,諸如垃圾短訊偵測、解決小學數學問題,以及根據特定文字回答問題等,來評估社會學習的成效。

研究人員表示,即使語言模型只接收少數範例,仍然能獲得良好的任務解決能力。而這個方式的重要性在於,即便存在隱私顧慮,也能夠實現知識轉移,在研究人員的垃圾訊息偵測任務中,位於裝置上的教師模型從用戶所標記的資料學習,這些資料是將短訊息標記為垃圾訊息或是非垃圾訊息,而在教師獲得偵測垃圾訊息知識後,無須直接分享可能侵犯個人隱私的資料,就可以協助學生模型區分垃圾和非垃圾訊息。

教師模型可以依據實際資料集,合成出新的範例並與學生共享,合成資料集與原始資料雖足夠不同,但是卻又具有相同的教育意義,這樣即便教師模型不直接共享真實原始資料,學生模型仍然能夠從合成資料中學習。實驗結果顯示,當合成範例足夠多,例如只要達到16個,直接共享原始資料,與透過社會學習使用合成資料進行教學之間,模型解決任務的能力就沒有顯著統計上的差異。

研究人員還嘗試了合成指令的方式,讓教師模型針對特定任務生成指令,學生模型依據指令學習執行任務的方式,就如同人類以口頭指令來學習和執行新任務的方式一樣。而實驗證明,生成指令能夠提高模型執行任務的效能,相比於零樣本學習,合成指令能達到與少樣本學習相當的準確性,研究人員表示,這顯示出語言模型在遵循指令上的強大能力。

不過也有部分任務,因為複雜的格式輸出要求,使得教師模型無法提供良好的指令。此外,部分任務合成範例的效果比合成指令表現更好,也有部分任務合成指令可獲得更高的準確性,研究人員解釋,這代表教師模型的教學方法需要因任務而異。

在社會學習中,研究人員希望教師模型能夠在不透露原始資料具體內容的情況下教導學生模型,透過採用秘密共享者(Secret Sharer)方法,來量化過程中可能洩漏資訊的程度。藉由設計金絲雀資料點,來測試教師模型是否會在無意間將原始資料內容透露給學生模型,而實驗證實,教師模型的確僅是運用原始資料生成教學內容,而不是單純複製範例給學生模型。

熱門文章
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
首頁
遊戲
合作
發現
我的