何时放手运行,何时手动操纵
是否让智能体无人值守地运行,归结为三个问题——把它们当成你离开之前要过一遍的清单。
- 爆炸半径。 如果出错,会坏掉多少?对整个代码库做一遍格式化,爆炸半径很小。数据库迁移或改动你的认证逻辑,则很大。半径越大,越要手动操纵。
- 可逆性。 能否廉价地撤销?在工作树干净的新建 git 分支上的工作是可逆的——
git restore .它就没了。删除数据、发送邮件、扣卡、推送到生产环境的工作则不是。绝不要让智能体无人值守地处理你拿不回来的东西。 - 可验证性。 你能判断结果是否正确吗?如果「完成」意味着一套绿色的测试或一个可见地正常工作的页面,你几秒内就能验证,智能体非常合适。如果「完成」取决于微妙的判断——金额计算、安全规则、竞态条件——你无法靠一次快速检查来设卡,那就贴近些。
把它们合起来的简单办法:当工作可逆且结果廉价可验证时放手运行;当不是时则手动操纵。 把构建功能那章的规则带过来——爆炸半径越大,步骤越小——再加上它的孪生规则:爆炸半径越大,缰绳越短。