DeepMind公佈整合2種思維模式的Talker-Reasoner AI代理人框架
支付動態 · 2024-10-26

Google DeepMind團隊設計一種由雙系統組成的Talker-Reasoner代理人框架,能同時執行對話及多步驟推理任務

Google DeepMind

Google DeepMind上週公佈具備2種思維模式的系統框架,可讓AI代理人(agent)能兼具快、慢思考的效益。

現有大型語言模型能以自然語言和使用者互動,具有二種能力,包括對話和規劃/思考。DeepMind團隊設計的一種由雙系統組成的Talker-Reasoner代理人框架,能同時執行對話及多步驟推理任務,一如由以色列諾貝爾經濟學家Daniel Kahneman提倡的「快思慢想」(之後也被翻譯成多國語言版本,包括繁中版)的人類一樣。

DeepMind設計的雙系統代理人框架中,系統1 Talker LLM能執行快速、直覺及合成語言回應,負責感知觀察外界、獲得用戶回應,並且以自然對話和用戶互動。系統2 Reasoner LLM負責解決複雜的問題,這牽涉從外界取得資訊增強其知識,像是呼叫工具、從外部資料庫獲取資訊。相較Talker LLM的快速回應,Reasoner的運行更為緩慢、深刻及具邏輯性,包含多階段推理和規劃、呼叫、執行行為等動作。Talker和Reasoner之間經由共同記憶體互動。Reasoner獲得知識後,除了執行行為,也更新其(記憶體中的)知識信仰,並提供Talker產生新的說話內容。在接獲使用者互動輸入問題時,Talker可以以現有知識為基礎、提供直覺回應,也可以等待Reasoner代理人產出知識,延遲回應使用者。

DeepMind團隊利用Gemini 1.5 Flash設計出包含雙系統AI代理人,在測試中,讓該系統扮演使用者睡眠指導顧問,在聽取使用者說明後,提供改善睡眠的建議。研究團隊發現,系統在「理解」使用者問題階段,其代理人(Talker)直覺化、流暢回應使用者,但當Reasoner未能理解其指導是哪個階段時,會提供較直覺化而無用的建議。例如使用降噪窗簾及隔音板。為解決此問題,研究團隊加入「指導」階段說明,Talker一旦讀取到指導階段時,就會等待Reasoner提供的資訊,而非直覺回應用戶。這時系統2就取得主導,而非只給系統1產出的回應,例如為房間換顏色柔和的壁紙。

研究人員指出,本研究是首個使用雙系統的代理人,欲改善其效用,未來可以讓Talker-Reasoner框架中的Talker自動判斷是否加入System 2的資訊作為回應,或是System 2加入更多Reasoner,以多元化其輸入的記憶資訊。

熱門文章
橫跨全球6個城市,灰度8場派對邀你共看世界盃,重塑高質量社交新場景
灰度頭條
GGC Awards 2026 璀璨科倫坡:致敬 iGaming 行業的領航者與創新力量
灰度頭條
灰度在iGB L!VE 2026展位T70和你相約7月,一起點燃倫敦的熱情!
灰度頭條
印第安納州在線賭場法案在眾議院委員會停滯不前
合規與政策
越南博彩管控逐步放寬,惟本土需求仍顯乏力
東南亞資訊
英國確認各垂直行業的賭博稅稅率
合規與政策
菲律賓博彩技術賽道迎來新變局,B2B 供應模式加速滲透
東南亞資訊
菲律賓網絡賭博和加密貨幣仍構成持續的洗錢風險
東南亞資訊
越南在線博彩業政策收緊 催生市場新機遇
東南亞資訊
巴西擬將博弈稅率提高至24% 稅收將用於社保與醫療領域
合規與政策
新澤西州7月博彩收入創6.06億美元新高,頒布禁令
合規與政策
哈薩克計劃對線上賭場促銷活動進行處罰
合規與政策
斯里蘭卡博弈產業大轉型,官方:劍指南亞拉斯維加斯
合規與政策
JILI 宣佈與全球板球傳奇 AB de Villiers(ABD)達成重磅戰略合作
體育遊戲
印度最高法院受理公益訴訟,要求全國禁封「偽裝」成社交遊戲的賭博平台
合規與政策
首頁
遊戲
合作
發現
我的