MLCommons成立AIS工作組,推動AI安全基準測試發展
· 2023-10-30

MLCommons成立人工智慧安全工作組,建立一個由多方貢獻的測試平臺,並建立人工智慧安全基準,該平臺將先使用史丹佛大學的HELM框架,針對大型語言模型設立安全基準,對安全性進行評分

開放工程聯盟MLCommons宣布成立人工智慧安全(AI Safety,AIS)工作組,該工作組的目標是要建立一個平臺,由許多貢獻者組成測試池,支援各種使用案例的人工智慧安全基準。該工作組最初的重點,將會使用史丹佛大學所開發的Holistic Evaluation of Language Models(HELM)框架,作為大型語言模型開發安全基準。

MLCommons是一個開放協作的生態系,目的在於推動機器學習的發展和應用,該組織的重點在於發展基準測試、最佳實踐、資料集和各種共享資源上,以促進機器學習社群的成長與創新。像是該組織在9月時就發布了人工智慧基準測試,用以強化模型推論和儲存評估。

雖然人工智慧系統對社會帶來巨大利益,但也存在風險,輸出可能存在毒性、錯誤資訊和偏見,MLCommons指出,人工智慧與其他複雜技術一樣,社會需要一個產業標準的安全測試,在實現利益的同時,最大程度降低風險。

MLCommons的新平臺將提供一個機制,讓使用者能夠從測試池中選擇基準測試,並將輸出整合成容易理解的分數,類似其他產業標準的方式,如汽車安全測試和能源之星評分,對人工智慧系統的安全性進行評級。

該平臺的短期重點,在於支援嚴謹可靠的人工智慧安全測試技術發展,AIS工作組會運用成員和人工智慧社群的技術與營運專業,用以創建人工智慧安全基準測試技術。而AIS工作組的第一個任務,便是替大型語言模型制定安全基準,以史丹佛大學基礎模型研究中心的研究成果,以及歷經兩年時間開發的HELM框架作為基礎,開發大型語言模型安全基準。

除了HELM框架之外,AIS工作組中多個成員,也計畫將內部用於人工智慧安全測試技術公開,與MLCommons社群共享,加速安全基準發展腳步。AIS工作組是一個多學科與跨領域的集合體,專家來自Anthropic、Coactive AI、Google、Inflection、英特爾、Meta、微軟、Nvidia、OpenAI、Qualcomm等多家人工智慧領域重要公司,同時還有來自學術界的Joaquin Vanschoren、Percy Liang與Bo Li等多位人工智慧重要學者。

AIS工作組透過整合不同領域專家知識和經驗,共同創建和指導人工智慧安全基準測試技術,該工作組鼓勵社群開放參與以吸引更多專家,加入推動此人工智慧安全議題。

热门文章
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
2027 Global Game Connect(GGC)斯里兰卡招商全面开启!业务人脉尽在掌握!
灰度头条
GGC Awards 2026 璀璨科伦坡:致敬 iGaming 行业的领航者与创新力量
灰度头条
灰度在iGB L!VE 2026展位T70和你相约7月,一起点燃伦敦的热情!
灰度头条
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
亚洲游戏市场观察:15大市场热门游戏与用户趋势
线上游戏
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
哈萨克斯坦计划对在线赌场促销活动进行处罚
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
越南博彩管控逐步放宽,惟本土需求仍显乏力
东南亚资讯
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
首页
游戏
合作
发现
我的