AIインシデントデータセット

Incident Collector(AI Guardrail Labのエージェント #1)には素材が必要です。4つの定番ソースから10件以上のインシデントをキュレーションしています。

ソース

ソース	提供される情報
OECD AI Incidents and Hazards Monitor (AIID)	構造化フィールド付きの政府レベルのインシデントカタログ
AIAAIC Repository	独立系ジャーナリズム的なインシデントアーカイブ
Stanford AI Index — AI関連インシデント	学術レベルでカタログ化された事例
Damien Charlotinのトラッカー	実務家がキュレーション、裁判判例にフォーカス

インシデントレコードの形式

キュレーション済みインシデントは1レコード1行のJSONLです。

{
  "id": "INC-2024-0142",
  "title": "...",
  "date_occurred": "2024-08-15",
  "system_type": "LLM chatbot",
  "deployment_context": "customer support",
  "harm_type": ["misinformation", "financial"],
  "severity": 4,
  "description": "...",
  "sources": ["...", "..."],
  "lessons": "...",
  "related_incidents": ["INC-2024-0089"]
}

なぜJSONLか

Incident Collectorは1行ずつレコードを読み、処理し、.md サイドカーを書き出します(Stage 2)。その後Stage 3の分析者群 — Root Cause、Threat Modeling、Guardrail Designer — が同じレコードを異なる観点から読みます。

JSONLはパイプラインのストリーミング処理性とgrep容易性を維持します。

ダウンロード

形式	リンク
JSONL (正本)	公開時にリンクを追加
CSV (Excel向け)	(JSONLから自動生成)
Markdown (人間可読)	(自動生成、インシデント1件につき1ファイル)

拡張方法

NBSエンジニアの皆様は、独自のインシデント — 社内のポストモーテム、ニアミス、可観測性の異常 — を追加できます。スキーマはオープンです。設定された受信箱にレコードを置けば、Incident Collectorが自動で取り込みます。

次に読む

9つのエージェント Incident Collectorはエージェント #1 — ラインナップ全体を確認できます。

Day 2リビールこのデータセットをライブで取り込むリビールセッション。

参考資料参考資料ハブに戻る。