DeepMind發展用LLM解困難數學問題的方法
· 2023-12-17

為了用AI解決數學和電腦科學難題,DeepMind的FunSearch的方法運用大型語言模型和評估器(Evaluator),研究人員預期,FunSearch將可為現有科學和工業領域新舊問題找到更好的解法

大型語言模型能幫忙做許多事情,DeepMind發展出一種稱為FunSearch的方法,利用大型語言模型搜尋數學和電腦科學領域問題的解法。研究人員目前成功運用FunSearch解決Cap Set數學問題,同時還可以更有效地解決裝箱問題,能夠用於提高資料中心效率等應用,而這也代表著FunSearch存在實用價值。

FunSearch的名稱指的是搜尋函式(Functions)的系統,FunSearch運作方式結合一個訓練過的大型語言模型,和一個自動評估器(Evaluator)。大型語言模型的目標,是提供創意的解決方案,而評估器則負責把關大型語言模型所提出的建議,避免出錯或是任何不實的想法。藉由這兩個元件反覆迭代,使得初始解決方案可以逐漸成熟最終成為新知識。

FunSearch使用Google的PaLM 2模型,但也能相容於其他支援程式碼編寫的大型語言模型。使用者需要先以程式碼的形式描述問題,包括評估程式的流程,以及初始程式碼池中的種子程式,而在每一次迭代,系統會從當前的程式池中挑選程式輸入大型語言模型,大型語言模型會在現有程式基礎上生成具創造性的新程式,交由評估器自動評估,表現最佳的程式會重新加入到程式池中,重新開始另一次迭代。

數學和電腦科學領域的難題都可以使用FunSearch解決,而組合數學(Combinatorics)是FunSearch特別擅長的領域。具體來說,FunSearch可以更好的解決極值組合數學問題,像是在高維度網格中尋找最大的點集合,也就是Cap Set的問題,這個問題無法使用暴力法解決,因為需要考慮的可能性太多,而FunSearch的效能優於目前最先進的計算求解器。

不過Cap Set畢竟是純數學問題,FunSearch的實用性還需要有更實際的應用驗證,而研究人員也成功使用FunSearch解決裝箱問題(Bin Packing Problem)。裝箱問題是將不同大小物品放進最少數量容器的問題,在許多實際場景都會派上用場,像是貨櫃裝載甚至是資料中心的計算任務分配等。

過去,裝箱問題的解法是基於人類經驗的演算法規則,也就是啟發式方法,像是「優先放置最大」等簡單的規則,雖然許多情況下,啟發式方法可以提供有效的解決方法,但是無法總是找到最佳解,要根據每個情況找到一套適用的規則也非常困難。

而FunSearch提供一種新的解決方案,能夠自動生成針對特定情況調整的程式,在使用更少的容器打包相同數量物品的問題上,超越現有的啟發式方法。研究人員提到,與其他神經網路和增強學習的人工智慧方法相比,FunSearch輸出程式碼易於檢查和部署,也就代表更容易被整合到實際工業系統中。

FunSearch的研究價值在於,只要有效防範大型語言模型的幻覺(Hallucination),則模型的創造能力便可以用來產生各種新的數學解法,解決現實世界的重要問題,研究人員預期,在科學和工業領域各種新舊問題,都會因為這個基於大型語言模型的方法,產生更加有效的解法。

熱門文章
英國確認各垂直行業的賭博稅稅率
合規與政策
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
超級PAC籌資4800萬美元:體育博彩勢力加碼
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
西班牙監管機構警告在線賭博平臺存在身份盜竊行為
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
首頁
遊戲
合作
發現
我的