Итоги и практика
Ключевые выводы
- Агенты умножают твою способность точно формулировать, чего ты хочешь, и распознавать, получил ли ты это, — но не заменяют её.
- Ограничение области окупается дважды: узко поставленная задача даёт diff, который ты реально можешь проверить, а размытая — такой, что не можешь.
- Проверяй diff, а не всю кодовую базу —
git diff --statза секунды покажет расползание области, а зелёный набор тестов никогда не заменит запуска вживую. - Никогда не запускай агентный цикл без ограничителя против платного ; задай каждому циклу жёсткий предел — максимум итераций, лимит трат или тайм-аут.
- Понаблюдай за первыми прогонами в переднем плане, чтобы убедиться, что агент сходится, прежде чем доверить ему работу в фоне.
Попробуй сам
Возьми небольшую, чётко ограниченную задачу и передай её агенту с явным условием остановки («остановись после 3 попыток» или «остановись, если тесты провалятся ещё дважды»). Понаблюдай за прогоном от начала до конца в переднем плане, затем проверь только diff через git diff --stat, а следом git diff. Если изменения затрагивают больше файлов, чем ты ограничил, это сигнал ужать задание и запустить заново.
Промпт главы
I'm giving you an autonomous task. Obey these guardrails exactly:
- SCOPE: only touch [list the files/modules]. If the fix needs more,
STOP and tell me instead of expanding scope.
- GOAL: [one concrete, checkable outcome].
- STOP CONDITIONS: stop after 3 attempts, OR if tests fail twice in a
row, OR if you've made changes outside the scope above.
- COST: do not call any paid API in a loop without a hard cap.
- REPORT: when you stop, show me `git diff --stat`, the test result,
and one sentence on whether you converged or got stuck.
Begin, and narrate each attempt so I can watch you converge.