MLCommons成立AIS工作組,推動AI安全基準測試發展
· 2023-10-30

MLCommons成立人工智慧安全工作組,建立一個由多方貢獻的測試平臺,並建立人工智慧安全基準,該平臺將先使用史丹佛大學的HELM框架,針對大型語言模型設立安全基準,對安全性進行評分

開放工程聯盟MLCommons宣布成立人工智慧安全(AI Safety,AIS)工作組,該工作組的目標是要建立一個平臺,由許多貢獻者組成測試池,支援各種使用案例的人工智慧安全基準。該工作組最初的重點,將會使用史丹佛大學所開發的Holistic Evaluation of Language Models(HELM)框架,作為大型語言模型開發安全基準。

MLCommons是一個開放協作的生態系,目的在於推動機器學習的發展和應用,該組織的重點在於發展基準測試、最佳實踐、資料集和各種共享資源上,以促進機器學習社群的成長與創新。像是該組織在9月時就發布了人工智慧基準測試,用以強化模型推論和儲存評估。

雖然人工智慧系統對社會帶來巨大利益,但也存在風險,輸出可能存在毒性、錯誤資訊和偏見,MLCommons指出,人工智慧與其他複雜技術一樣,社會需要一個產業標準的安全測試,在實現利益的同時,最大程度降低風險。

MLCommons的新平臺將提供一個機制,讓使用者能夠從測試池中選擇基準測試,並將輸出整合成容易理解的分數,類似其他產業標準的方式,如汽車安全測試和能源之星評分,對人工智慧系統的安全性進行評級。

該平臺的短期重點,在於支援嚴謹可靠的人工智慧安全測試技術發展,AIS工作組會運用成員和人工智慧社群的技術與營運專業,用以創建人工智慧安全基準測試技術。而AIS工作組的第一個任務,便是替大型語言模型制定安全基準,以史丹佛大學基礎模型研究中心的研究成果,以及歷經兩年時間開發的HELM框架作為基礎,開發大型語言模型安全基準。

除了HELM框架之外,AIS工作組中多個成員,也計畫將內部用於人工智慧安全測試技術公開,與MLCommons社群共享,加速安全基準發展腳步。AIS工作組是一個多學科與跨領域的集合體,專家來自Anthropic、Coactive AI、Google、Inflection、英特爾、Meta、微軟、Nvidia、OpenAI、Qualcomm等多家人工智慧領域重要公司,同時還有來自學術界的Joaquin Vanschoren、Percy Liang與Bo Li等多位人工智慧重要學者。

AIS工作組透過整合不同領域專家知識和經驗,共同創建和指導人工智慧安全基準測試技術,該工作組鼓勵社群開放參與以吸引更多專家,加入推動此人工智慧安全議題。

Popular articles
SBC Summit Canada to Make Player Safety a Key Pillar of 2026 Agenda
Marketing
Super PAC Raises $48 Million: Sports Betting Forces Ramp Up Political Push
Regulation
Vietnam’s Controlled Gaming Shift Gains Ground, But Domestic Demand Still Lags
Southeast Asia
Brazil Proposes Raising Gambling Tax Rate to 24%, With Revenue Allocated to Social Security and Healthcare
Regulation
GAT Expo Puerto Rico Will Pulse with the New Era of Gaming in the Caribbean
Marketing
JILI Partners with Cricket Legend AB de Villiers (ABD) to Launch Exclusive Branded Game Series 100% 11
Sports Game
Full House at GAT Expo Cartagena 2026 Academic Agenda
Online Game
UK MPs reopen 2025 gambling inquiry as reform stalls
Regulation
Are you ready to maximize your earnings? Try ProPush.me Constructor!
Marketing
Institutional Academy that exceeded expectations marked the opening of GAT CDMX
Online Game
PropellerAds Shared a New iGaming Case Study: 97,674 Installs and 12,701 Deposits in 3 Months
Marketing
B2B Tech Infrastructure Gains Momentum in Philippine Gaming Sector
Southeast Asia
Online gambling, crypto pose ongoing money laundering risks in Philippines, analyst says
Southeast Asia
Gaming & Technology Expo Makes a Powerful Entrance in CDMX
Marketing
Kazakhstan plans to penalise online casino promotions
Regulation
Home
Game
Cooperation
Find
My