9つのエージェント — AI Guardrail Labのラインナップ
ショーケースオフィスはAI Guardrail Labです — AIインシデント分析とガードレール設計に協働して取り組む9つの専用エージェントから構成されています。本システムはパートナー要件に基づきスコープを定め、ワークショップで実際に動く成果物として構築されました。
ラインナップ
1 · Incident Collector
OECD AIID、AIAAIC、Stanford、Damien Charlotinから実世界のAIインシデント事例を収集・整理します。Stage-1プラー相当。Sonnet。
2 · Root Cause
技術的、プロセス的、組織的要因を分析します。被害からメカニズムへ遡って分析。Opus。
3 · Threat Modeling
攻撃経路、悪用シナリオ、被害ベクトルをマッピングします。STRIDE方式の敵対的分析。Opus。
4 · Guardrail Designer
予防、検知、ブロック、監査の各種コントロールを設計します。インシデントファミリーごとのコントロールセットを出力。Opus。
5 · Dev Process
ガードレールをSDLC/PDLCワークフローに統合します。Pre-commitフック、CIゲート、リリースチェック。Sonnet。
6 · Policy-as-Code
チェックリスト、設定、フック、テストを生成します。「ポリシーをコード化」する生産担当。Sonnet。
7 · Claude Hook
Claude CodeおよびClaude Agent SDK向けの自動チェック。具体的なフック実装を提供します。Sonnet。
8 · Evidence & Audit
意思決定の経緯、参照、結果、承認を保持します。来歴の番人。Sonnet。
9 · Critic
抜け漏れや盲点をレビューします。「何が欠けているか」を見つけるエージェント。Opus。
どう協働するか
インシデント到着時の典型的なフロー。
1 Incident Collector ──► raw incident report2 Root Cause ──► technical + process + org factors3 Threat Modeling ──► attack paths from this incident family4 Guardrail Designer ──► control set5 Dev Process ──► where in the SDLC to insert controls6 Policy-as-Code ──► checklists, configs, tests7 Claude Hook ──► concrete hook code8 Evidence & Audit ──► decision trail captured9 Critic ──► what did we miss?順次パイプラインです。各エージェントは前段のエージェントが書いた内容を読みます。ステップ9のCriticは、任意の前段エージェントの再実行を起動できます。
なぜ9つで、5つではないのか
当初の要件は AIインシデント分析とガードレール設計エージェント でした。3つのスーパーエージェント(コレクター + 分析者 + デザイナー)にまとめることもできましたが、9つにすることで以下が得られます。
- エージェントごとの予算制御(Opusは必要な箇所のみ — Root Cause、Threat Modeling、Guardrail Designer、Critic)
- SOULの境界がより明確に
- エージェント単位の拡張が容易 — エンジニアは他に触れずCriticだけを書き換え可能
- 監査トレイルがより読みやすい — どのエージェントがどの主張を書いたかが明確
次に読む
プラットフォームではなく、アプリケーション
9エージェントのGuardrail Labは、基盤の上に構築された1つのアプリケーションです。基盤は同じまま、異なるチームが異なるオフィスをその上に構築します。これは最初の事例であり、今後さらに多くが生まれます。