DeepMind公布集成2种思维模式的Talker-Reasoner AI代理人框架
支付動態 · 2024-10-26

Google DeepMind团队设计一种由双系统组成的Talker-Reasoner代理人框架,能同时运行对话及多步骤推理任务

Google DeepMind

Google DeepMind上周公布具备2种思维模式的系统框架,可让AI代理人(agent)能兼具快、慢思考的效益。

现有大型语言模型能以自然语言和用户交互,具有二种能力,包括对话和规划/思考。DeepMind团队设计的一种由双系统组成的Talker-Reasoner代理人框架,能同时运行对话及多步骤推理任务,一如由以色列诺贝尔经济学家Daniel Kahneman提倡的「快思慢想」(之后也被翻译成多国语言版本,包括繁中版)的人类一样。

DeepMind设计的双系统代理人框架中,系统1 Talker LLM能运行快速、直觉及合成语言回应,负责感知观察外界、获得用户回应,并且以自然对话和用户交互。系统2 Reasoner LLM负责解决复杂的问题,这牵涉从外界取得信息增强其知识,像是调用工具、从外部数据库获取信息。相较Talker LLM的快速回应,Reasoner的运行更为缓慢、深刻及具逻辑性,包含多阶段推理和规划、调用、运行行为等动作。Talker和Reasoner之间经由共同内存交互。Reasoner获得知识后,除了运行行为,也更新其(内存中的)知识信仰,并提供Talker产生新的说话内容。在接获用户交互输入问题时,Talker可以以现有知识为基础、提供直觉回应,也可以等待Reasoner代理人产出知识,延迟回应用户。

DeepMind团队利用Gemini 1.5 Flash设计出包含双系统AI代理人,在测试中,让该系统扮演用户睡眠指导顾问,在听取用户说明后,提供改善睡眠的建议。研究团队发现,系统在「理解」用户问题阶段,其代理人(Talker)直觉化、流畅回应用户,但当Reasoner未能理解其指导是哪个阶段时,会提供较直觉化而无用的建议。例如使用降噪窗帘及隔音板。为解决此问题,研究团队加入「指导」阶段说明,Talker一旦读取到指导阶段时,就会等待Reasoner提供的信息,而非直觉回应用户。这时系统2就取得主导,而非只给系统1产出的回应,例如为房间换颜色柔和的壁纸。

研究人员指出,本研究是首个使用双系统的代理人,欲改善其效用,未来可以让Talker-Reasoner框架中的Talker自动判断是否加入System 2的信息作为回应,或是System 2加入更多Reasoner,以多元化其输入的记忆信息。

热门文章
巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域
游戏风向
PropellerAds 分享了新的 iGaming 案例研究:在 3 个月实现 97,674 次安装和 12,701 笔存款
广告营销
英国确认各垂直行业的赌博税税率
游戏风向
JILI 宣布与全球板球传奇 AB de Villiers(ABD)达成重磅战略合作
体育游戏
张侨伟参议员排除全面禁止,敦促菲律宾规范网络赌博
东南亚资讯
超级PAC筹资4800万美元:体育博彩势力加码
游戏风向
新泽西州7月博彩收入创6.06亿美元新高,颁布禁令
游戏风向
准备好了将你的收益最大化吗?尝试ProPush.me Constructor!
广告营销
横跨全球6个城市,灰度8场派对邀你共看世界杯,重塑高质量社交新场景
灰度头条
斯里兰卡博弈产业大转型,官方:剑指南亚拉斯维加斯
游戏风向
灰度世界杯嘉年华狂欢派对吉隆坡站即将开启,业务拓展人脉社交从马来西亚开始
灰度头条
BETFAIR 网络攻击80万用户资料泄露
游戏风向
巴西颁布新法赋权央行封锁非法博彩账户及 Pix 交易
支付动态
印度最高法院受理公益诉讼,要求全国禁封“伪装”成社交游戏的赌博平台
游戏风向
菲律宾博彩技术赛道迎来新变局,B2B 供应模式加速渗透
东南亚资讯
首页
游戏
合作
发现
我的