史丹佛大學 AI 年度報告出爐：模型基準測試表現已和人類相當-灰度官网

史丹佛大學 AI 年度報告出爐：模型基準測試表現已和人類相當

· 2024-04-16

史丹佛大學的年度 AI 報告指出哪七項趨勢？

史丹佛大學人本 AI 研究機構發布了 2024 年度 AI 報告，追蹤 AI 在研發、技術、經濟、政策、輿論等方面的趨勢，機構也摘要了一下幾大趨勢來分享：

趨勢一、開源模型數量超越閉源模型

開源模型的數量正在上升中，去年各組織釋出的 149 個基礎模型中，有 65.7% 為開源模型；回顧 2022 年所發布的模型中（比今年約少一倍多），僅 44.4% 為開源模型，2021 年則只佔 33.3%。

模型表現上閉源目前仍優於開源模型。在 10 個選定的基準測試中，閉源模型分數的中位數為 24.2% 的中位數效能優勢。閉源和開源模型之間的分數差異範圍很廣，像在 GSM8K 等數學測試上中兩者差異只有 4.0%，但在 AgentBench 等代理任務上的差異可高達 317.7%。

趨勢二、模型發布數最高的公司和國家：Google、美國

企業端目前仍主導 AI 模型的建構和發布，去年新推出的基礎模型有 72% 來自業界，其中 Google 發布了最多款 AI 模型，包括 Gemini 等。事實上 Google 自 2019 年來一直守住模型數量冠軍位置，共發布 40 個，其次則是 OpenAI，在四年多期間共推出 20 個模型。

生成式 AI 更是在去年吸引到 252 億美元的私人投資，佔 AI 總投資的四分之一以上，總價為 2022 年近 9 倍、2019 年的 30 倍。

以國家來看機器學習模型的數量，美國在 2023 年以 61 個遠超其他國家，其次則是中國的 15 個模型。美國對 AI 的私人投資也佔領導地位，總投資金額為 672 億美元，是排第二的中國的 8.7 倍。

趨勢三、AI 訓練成本呈指數級升高

訓練 AI 模型的成本呈指數級增長，這也是學術界和政府會在 AI 競賽中輸給業界的一大原因。訓練 Google Gemini Ultra 的運算成本約為 1.91 億美元，而 OpenAI 的 GPT-4 的訓練成本則估計是 7,800 萬美元，反觀 2017 年最初 Transformer 模型的成本約為 900 美元。

趨勢四、AI 在測試中的表現接近人類水準

截至 2023 年，AI 在許多基準測試中（包括閱讀理解、視覺推理等）皆達到人類的表現，不過 AI 還是在部分測試（例如競賽等級數學）上還無法達人類能力。也因為 AI 正在突破現有的標準基準，AI 學者要因應製作出新測試和更困難的挑戰，包括程式碼編寫、高階推理和代理行為任務等基準。

趨勢五、AI 相關規範數量上升

越來越多的美國監管機構正透過規範來管理 AI 工具和資料的使用，涵蓋了 AI 生成之作品的版權註冊指南、網路安全風險管理策略等，去年度美國共有 25 份 AI 相關規範。

趨勢六、企業 AI 接納度提高、聯絡中心是常見應用場景

越來越多的公司將 AI 導入應用，在調查中有 55% 的組織表示去年度有使用到 AI，高於 2022 年的 50% 和 2017 年的 20%。最常見的應用場景包括，透過 AI 來自動化聯絡中心、提供個人化內容，並獲取新客戶。

趨勢七、過半年輕族群認為 AI 會影響工作、日本焦慮感最低

全球調查中有 57% 的人認為 AI 將在未來 5 年內改變工作方式，尤其年輕一代（Z 世代和千禧世代）感覺更加強烈。Z 世代有 66% 的受訪者認為 AI 會對工作帶來實質影響，嬰兒潮世代則是 46% 的受訪者覺得會有影響。

另外，收入較高、受教育程度較高，或擔任決策角色的受訪者，預估 AI 會對工作產生較巨大的影響。

在受訪的 31 個國家中，對 AI 感到最焦慮的國家是澳洲，受訪的澳洲人當中有 69% 對 AI 感到緊張，其次則是英國（有 65%），日本是擔憂程度最低的（23%）。

：Sisley

快加入 INSIDE Google News 按下追蹤，給你最新、最 IN 的科技新聞！

熱門文章

斯里蘭卡博弈產業大轉型，官方：劍指南亞拉斯維加斯

合規與政策

哈薩克計劃對線上賭場促銷活動進行處罰

合規與政策

橫跨全球6個城市，灰度8場派對邀你共看世界盃，重塑高質量社交新場景

灰度頭條

西班牙監管機構警告在線賭博平臺存在身份盜竊行為

合規與政策

新澤西州7月博彩收入創6.06億美元新高，頒布禁令

合規與政策

菲律賓博彩技術賽道迎來新變局，B2B 供應模式加速滲透

東南亞資訊

亞洲遊戲市場觀察：15大市場熱門遊戲與用戶趨勢

網路遊戲

菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險

東南亞資訊

巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域

合規與政策

越南在線博彩業政策收緊催生市場新機遇

東南亞資訊

英國確認各垂直行業的賭博稅稅率

合規與政策

印第安納州在線賭場法案在眾議院委員會停滯不前

合規與政策

印度最高法院受理公益訴訟，要求全國禁封「偽裝」成社交遊戲的賭博平台

合規與政策

超級PAC籌資4800萬美元：體育博彩勢力加碼

合規與政策

越南博彩管控逐步放寬，惟本土需求仍顯乏力

東南亞資訊

首頁

遊戲

合作

發現

我的