MLCommons發布AI基準測試新套件,強化模型推論和儲存評估
· 2023-09-13

MLCommons推出MLPerf Inference v3.1和MLPerf Storage v0.5基準測試,用於評估人工智慧模型推論和儲存效能,促進技術公平比較

開放工程聯盟MLCommons公布兩個最新的基準測試套件MLPerf Inference v3.1和MLPerf Storage v0.5,MLPerf Inference又分為邊緣與資料中心,用於測量系統使用經過訓練的模型,處理輸入和生成結果的速度,而MLPerf Storage則可以衡量在訓練模型時,儲存系統提供訓練資料的速度。

基準測試對於發展人工智慧與機器學習技術至關重要,基準測試可以提供標準化環境,供研究人員公平地比較不同的演算法和系統效能,由於基準測試除了資料集之外,還包含評估指標,因此所有研究者都可以使用相同的標準,使結果更具比較性。也就是說,基準測試能夠提供一個客觀、量化且可重複的方法,用於評估人工智慧與機器學習技術的效能,促進該領域健康發展。

目前生成式人工智慧聊天機器人、自動車輛的安全功能,或是語音轉文字介面等,都離不開機器學習推論,而MLPerf Inference則可衡量各種場景執行模型的速度。MLPerf Inference v3.1具有新的大型語言模型(Large Language Model,LLM)與推薦基準測試,大型語言模型的測試是以GPT-J參考模型總結CNN新聞文章,推薦基準測試則更新推薦器,使用DLRM-DCNv2參考模型與更大的資料集,以更貼近產業實踐。

MLPerf Inference主要關注邊緣和資料中心系統的模型推論,針對v3.1版本的提交呈現了多種處理器、加速器,在電腦視覺、推薦系統和語言處理等領域的應用表現,資料提交又分為開放和封閉兩類,並且有效能、功率和網路三大類別。封閉類使用相同的參考模型,確保不同系統表現的公平性,而開放提交則允許參與者使用各種不同的模型。目前MLPerf Inference已有26個提交者,MLCommons總共收到13,500個效能結果提交,以及2,000個功率結果。

而MLPerf Storage則是目前第一個,用於測量機器學習訓練工作負載儲存效能的開源人工智慧與機器學習基準套件,由於訓練神經網路是運算密集,同時也是資料密集的任務,因此高效能儲存系統能夠維持整體系統的效能和可用性。

官方提到,MLPerf Storage基準由超過10個業界和學術組織合作創建,具有像是平行檔案系統、本地儲存和軟體定義儲存等各種儲存配置。MLPerf Storage或將成為購買、配置和最佳化機器學習應用程式儲存的評估工具。

熱門文章
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
英國確認各垂直行業的賭博稅稅率
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
首頁
遊戲
合作
發現
我的