まとめと練習
重要なポイント
- エージェントは、望むものを正確に言い、それを得られたかを見分ける能力を倍加させるだけで、置き換えはしない。
- スコープ設定は二度報われる: 狭く絞ったタスクは実際にレビューできるdiffを生み、緩いタスクはレビューできないdiffを生む。
- コードベースではなくdiffをレビューしよう —
git diff --statは数秒でスコープの逸脱を示し、緑のテストスイートが実際に動かすことの代わりになることはない。 - 有料に対してスロットルなしのエージェントループを絶対に回さない。どのループにもハードキャップを — 最大反復回数、支出上限、またはタイムアウトを設けよう。
- バックグラウンド実行を信じる前に、最初の実行をフォアグラウンドで見守り、エージェントが収束するか確認しよう。
試してみよう
小さく境界の明確なタスクを一つ選び、明示的な停止条件(「3回試行したら停止」または「テストがあと2回失敗したら停止」)とともにエージェントに渡す。フォアグラウンドで実行を最後まで見守り、それからgit diff --statに続けてgit diffでdiffだけをレビューする。変更がスコープに定めたより多くのファイルに触れていたら、それがブリーフを締め直して再実行する合図だ。
この章のプロンプト
I'm giving you an autonomous task. Obey these guardrails exactly:
- SCOPE: only touch [list the files/modules]. If the fix needs more,
STOP and tell me instead of expanding scope.
- GOAL: [one concrete, checkable outcome].
- STOP CONDITIONS: stop after 3 attempts, OR if tests fail twice in a
row, OR if you've made changes outside the scope above.
- COST: do not call any paid API in a loop without a hard cap.
- REPORT: when you stop, show me `git diff --stat`, the test result,
and one sentence on whether you converged or got stuck.
Begin, and narrate each attempt so I can watch you converge.