コンテンツにスキップ

AIインシデントデータセット

Incident Collector(AI Guardrail Labのエージェント #1)には素材が必要です。4つの定番ソースから10件以上のインシデントをキュレーションしています。

ソース

ソース提供される情報
OECD AI Incidents and Hazards Monitor (AIID)構造化フィールド付きの政府レベルのインシデントカタログ
AIAAIC Repository独立系ジャーナリズム的なインシデントアーカイブ
Stanford AI Index — AI関連インシデント学術レベルでカタログ化された事例
Damien Charlotinのトラッカー実務家がキュレーション、裁判判例にフォーカス

インシデントレコードの形式

キュレーション済みインシデントは1レコード1行のJSONLです。

{
"id": "INC-2024-0142",
"title": "...",
"date_occurred": "2024-08-15",
"system_type": "LLM chatbot",
"deployment_context": "customer support",
"harm_type": ["misinformation", "financial"],
"severity": 4,
"description": "...",
"sources": ["...", "..."],
"lessons": "...",
"related_incidents": ["INC-2024-0089"]
}

なぜJSONLか

Incident Collectorは1行ずつレコードを読み、処理し、.md サイドカーを書き出します(Stage 2)。その後Stage 3の分析者群 — Root Cause、Threat Modeling、Guardrail Designer — が同じレコードを異なる観点から読みます。

JSONLはパイプラインのストリーミング処理性とgrep容易性を維持します。

ダウンロード

形式リンク
JSONL (正本)公開時にリンクを追加
CSV (Excel向け)(JSONLから自動生成)
Markdown (人間可読)(自動生成、インシデント1件につき1ファイル)

拡張方法

NBSエンジニアの皆様は、独自のインシデント — 社内のポストモーテム、ニアミス、可観測性の異常 — を追加できます。スキーマはオープンです。設定された受信箱にレコードを置けば、Incident Collectorが自動で取り込みます。

次に読む