走出温室:长线生存的考验
上一章我们讲了只要有 ReAct 循环和 Tool Calling,Agent 就长出了翅膀和手脚,能够接上第三方代码办点事了。 但在现实中,用户丢过来的宏观任务往往是海量的、跨日的:“帮我查下周去东京的机票和三家酒店,做个对比如果总价低于 1 万就帮我先订机酒,然后写一份游记贴草稿并在周五发到我邮箱”。
这是一场需要跑几十上百轮 API 工具交互的漫长战役。
在这场漫长的拉锯战中,首先面临的就是内存塞不下的窘境,因为无休止的工具返回日志和历史行动记录很快就会把大语言模型的上下文窗口彻底撑爆。其次则是规划灾难,如果一上来就两眼一抹黑疯狂随机调用工具,跑错任何一个环节就会导致后续全盘皆输。最致命的是系统极其脆弱,一旦遇到诸如 API 密钥过期或者节点找不到的报错,模型往往两手一摊直接卡死退出。
本章我们就要给这个“执行机器”装上真正的“认知引擎”海绵:从多级记忆链条、前瞻式规划,到出了问题能自己狠狠扇自己一巴掌的“反思”机制。
1. 大脑的缓冲池:三层记忆管理
人在思考时,有些刚发生的事记在脑子里,有些童年的记忆只能需要的时候去翻日记本。Agent 的记忆架构也是按照这套逻辑设计的。