エージェントの自律度レベルと昇格基準#
AI エージェントを運用する際、「どこまで自律的に動かしていいか」は設計の根本に関わる決定。エージェントの自律度レベルを段階として捉えると、判断がぶれない。
5 段階の自律度#
flowchart LR
L1[L1<br/>提案のみ] --> L2[L2<br/>承認付き実行]
L2 --> L3[L3<br/>実行+報告]
L3 --> L4[L4<br/>例外時のみ承認]
L4 --> L5[L5<br/>完全自律]
L1: 提案のみ
エージェントは提案を返すだけ。実行は全て人間が行う。
- 例: 「このコードはこう直したほうが良いです」という提案
- 適したタスク: 初期段階、信頼構築前
L2: 承認付き実行
エージェントが計画を提示し、人間が承認したら実行する。
- 例: 「このファイルを編集します、よろしいですか?」
- 適したタスク: 破壊的操作、コスト発生、外部送信
L3: 実行 + 事後報告
エージェントが判断して実行。結果を必ず報告する。問題があれば人間が介入。
- 例: テスト実行、ログ収集、検索
- 適したタスク: 非破壊的・低リスク・反復的
L4: 例外時のみ承認
通常は完全自律。例外的な判断が必要な場合のみ人間に問い合わせ。
- 例: 定型業務の自動化、定期チェック
- 適したタスク: 長期運用で信頼を積んだ定型タスク
L5: 完全自律
人間の介入なしで動き続ける。停止条件と例外処理が明確であることが前提。
- 例: バックグラウンド監視、定期レポート生成
- 適したタスク: 完全に予測可能・失敗コストが低いタスク
どのレベルを選ぶかの判断軸#
flowchart TD
Q[タスク定義] --> R{失敗時の<br/>コスト?}
R -->|高| L1[L1-L2]
R -->|中| S{再現性は?}
R -->|低| M{頻度?}
S -->|高| L3[L3]
S -->|低| L1
M -->|高| L4[L4-L5]
M -->|低| L3
- 失敗コストが高い(本番 DB 操作、外部送信、決済): L1-L2
- 失敗コストが低い + 再現性が高い(情報収集、分析): L3
- 頻度が高く定型化された: L4-L5
昇格の条件#
L1 → L2 → L3 → L4 のように段階的に信頼を上げる。一気に自律度を上げない。
昇格基準の例:
- 3 セッション連続で採用率 70% 以上 → L1 から L2 に昇格
- エラー率 5% 以下が 1 ヶ月継続 → L3 から L4 に昇格
降格の条件#
事故が起きたら必ず 1 段階以上降格させる。
- 誤作動でデータを壊した → 即 L1 に戻す
- 例外処理が抜けていた → 1 段階下げる
アンチパターン#
- 最初から L5 にする: 信頼構築前の完全自律は事故のもと
- レベルを明示しない: チーム内で認識が揃わない。コードコメントや README に明記する
- 昇格基準がない: 感覚で上げると、根拠なく戻せない
まとめ#
自律度は一度決めて固定するものではなく、タスク単位で設定し、実績に応じて動かすもの。段階的に上げて、事故時は即降格。