AIインシデントデータセット
Incident Collector(AI Guardrail Labのエージェント #1)には素材が必要です。4つの定番ソースから10件以上のインシデントをキュレーションしています。
ソース
| ソース | 提供される情報 |
|---|---|
| OECD AI Incidents and Hazards Monitor (AIID) | 構造化フィールド付きの政府レベルのインシデントカタログ |
| AIAAIC Repository | 独立系ジャーナリズム的なインシデントアーカイブ |
| Stanford AI Index — AI関連インシデント | 学術レベルでカタログ化された事例 |
| Damien Charlotinのトラッカー | 実務家がキュレーション、裁判判例にフォーカス |
インシデントレコードの形式
キュレーション済みインシデントは1レコード1行のJSONLです。
{ "id": "INC-2024-0142", "title": "...", "date_occurred": "2024-08-15", "system_type": "LLM chatbot", "deployment_context": "customer support", "harm_type": ["misinformation", "financial"], "severity": 4, "description": "...", "sources": ["...", "..."], "lessons": "...", "related_incidents": ["INC-2024-0089"]}なぜJSONLか
Incident Collectorは1行ずつレコードを読み、処理し、.md サイドカーを書き出します(Stage 2)。その後Stage 3の分析者群 — Root Cause、Threat Modeling、Guardrail Designer — が同じレコードを異なる観点から読みます。
JSONLはパイプラインのストリーミング処理性とgrep容易性を維持します。
ダウンロード
| 形式 | リンク |
|---|---|
| JSONL (正本) | 公開時にリンクを追加 |
| CSV (Excel向け) | (JSONLから自動生成) |
| Markdown (人間可読) | (自動生成、インシデント1件につき1ファイル) |
拡張方法
NBSエンジニアの皆様は、独自のインシデント — 社内のポストモーテム、ニアミス、可観測性の異常 — を追加できます。スキーマはオープンです。設定された受信箱にレコードを置けば、Incident Collectorが自動で取り込みます。