DeepMind公布集成2种思维模式的Talker-Reasoner AI代理人框架-灰度官网

DeepMind公布集成2种思维模式的Talker-Reasoner AI代理人框架

支付動態 · 2024-10-26

Google DeepMind团队设计一种由双系统组成的Talker-Reasoner代理人框架，能同时运行对话及多步骤推理任务

Google DeepMind

Google DeepMind上周公布具备2种思维模式的系统框架，可让AI代理人（agent）能兼具快、慢思考的效益。

现有大型语言模型能以自然语言和用户交互，具有二种能力，包括对话和规划／思考。DeepMind团队设计的一种由双系统组成的Talker-Reasoner代理人框架，能同时运行对话及多步骤推理任务，一如由以色列诺贝尔经济学家Daniel Kahneman提倡的「快思慢想」（之后也被翻译成多国语言版本，包括繁中版）的人类一样。

DeepMind设计的双系统代理人框架中，系统1 Talker LLM能运行快速、直觉及合成语言回应，负责感知观察外界、获得用户回应，并且以自然对话和用户交互。系统2 Reasoner LLM负责解决复杂的问题，这牵涉从外界取得信息增强其知识，像是调用工具、从外部数据库获取信息。相较Talker LLM的快速回应，Reasoner的运行更为缓慢、深刻及具逻辑性，包含多阶段推理和规划、调用、运行行为等动作。Talker和Reasoner之间经由共同内存交互。Reasoner获得知识后，除了运行行为，也更新其（内存中的）知识信仰，并提供Talker产生新的说话内容。在接获用户交互输入问题时，Talker可以以现有知识为基础、提供直觉回应，也可以等待Reasoner代理人产出知识，延迟回应用户。

DeepMind团队利用Gemini 1.5 Flash设计出包含双系统AI代理人，在测试中，让该系统扮演用户睡眠指导顾问，在听取用户说明后，提供改善睡眠的建议。研究团队发现，系统在「理解」用户问题阶段，其代理人（Talker）直觉化、流畅回应用户，但当Reasoner未能理解其指导是哪个阶段时，会提供较直觉化而无用的建议。例如使用降噪窗帘及隔音板。为解决此问题，研究团队加入「指导」阶段说明，Talker一旦读取到指导阶段时，就会等待Reasoner提供的信息，而非直觉回应用户。这时系统2就取得主导，而非只给系统1产出的回应，例如为房间换颜色柔和的壁纸。

研究人员指出，本研究是首个使用双系统的代理人，欲改善其效用，未来可以让Talker-Reasoner框架中的Talker自动判断是否加入System 2的信息作为回应，或是System 2加入更多Reasoner，以多元化其输入的记忆信息。

热门文章

巴西拟将博彩税率提高至24% 税收将用于社保和医疗领域

游戏风向