Skip to content

feat(guardrails): delegation enforcement in plan mode — structural gap from dogfooding #159

@terisuke

Description

@terisuke

Problem

Dogfooding テスト (2026-04-08) と委任ルール構造的欠陥レポートで以下が判明:

欠陥 1: ExitPlanMode/TaskCreate にフックイベントなし

  • プラン承認はUIフロー(ExitPlanMode ツール呼び出し)だが、フックが登録されていない
  • どんな委任構成のプランでもノーチェックで承認される

欠陥 2: planning mode で委任チェックが免除

  • context-budget-agent-gate.sh が planning/research モードで exit 0
  • エージェント並列上限、Codex CLI上限、TeamCreate推奨が全て無効化

欠陥 3: Advisory hooks がブロックしない

  • cherry-pick/version-downgrade で LLM が先にツール呼び出しを自主判断で拒否
  • guardrail.ts の deny() に到達しないケースがある

Proposed Solution

  1. ExitPlanMode の PostToolUse フックで委任チェックを実行
  2. planning mode でも委任ルールのアドバイザリーチェックを有効化(ブロックではなく警告)
  3. LLM が先に判断する場合でも advisory メッセージを出力する仕組み

References

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions