Meta發布Purple Llama專案推動開源可信的生成式AI應用
· 2023-12-08

Meta的Purple Llama專案目的在於提供開放人工智慧工具和評估標準,以促進開發者發展負責任的生成式人工智慧應用,目前工具有CyberSec Eval評估標準,和Llama Guard輸入輸出安全分類器

Purple Llama是一個由Meta推出的新專案,目的在於提供開放信任且安全的評估標準與工具,使得開發者可以在遵守最佳實踐的指引下,負責任地部署生成式人工智慧模型與應用程式。Purple Llama目前提供CyberSec Eval評估標準,和Llama Guard輸入輸出安全分類器,之後會有更多的工具加入。

Meta推出Llama語言模型,總下載量已經超過1億次,支援著各種人工智慧應用的發展,而Meta的新一階段任務,是要推動發展負責任的人工智慧研究和應用,因此推出Purple Llama專案。之所以是紫色(Purple),Meta借用資安領域的紫隊概念,紫隊是攻擊紅隊和防禦藍隊的結合,在生成式人工智慧中評估和緩解潛在威脅,而官方也提到,這代表他們投資Purple Llama全面發展,兼顧攻擊和防禦策略。

Purple Llama在網路安全方面,著重在建立安全評估基準,包括量化大型語言模型網路安全風險的指標,以及評估不安全程式碼建議頻率的工具,還有讓生成惡意程式碼,或是協助網路攻擊更加困難的大型語言評估工具。官方提到,目前研究結果顯示,大型語言模型的確存在推薦不安全程式碼,以及在應對惡意請求方面存在明顯的安全風險。

在過濾輸出和輸入方面,Purple Llama提供了一個稱為Llama Guard的分類器,事實上Llama Guard是一個開放模型,可用於檢查和過濾大型語言模型的輸入和輸出,以符合特定應用的內容指導原則,防止大型語言模型生成具有潛在風險的輸出。Llama Guard使用公開的資料集訓練,以偵測常見的潛在風險和違規內容,用戶可以自定義模型,以支援特定用例。

除了發布Purple Llama,Meta也與包括AI聯盟、AMD、AWS、CloudFlare、Google雲端、Hugging Face、英特爾、微軟和Nvidia等各大科技公司合作,共同推動開放信任和安全的人工智慧生態系,同時,Meta也與Papers With Code、HELM的合作夥伴以及MLCommons AI安全工作小組合作,讓Purple Llama評估工具整合進他們的基準之中。

熱門文章
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
英國確認各垂直行業的賭博稅稅率
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
首頁
遊戲
合作
發現
我的