エージェントフレームワーク
脳をチームに変える。
モデル単体は思考できます。エージェントフレームワークがツール、記憶、そして委任の能力を与えることで — 一つの脳が組織全体の労働力へと変わります。
Piエージェントフレームワーク
Earendil Worksフレームワーク比較
| フレームワーク | インタラクション | ライセンス | マルチモデル | エージェントチーム | 無料枠 |
|---|---|---|---|---|---|
| 対話型CLI + API | プロプライエタリ | Claudeのみ | サブエージェント + フック | なし | |
Pi | 対話型ターミナル | MIT | 10以上のプロバイダー | 拡張機能経由 | 自己APIキー |
| 非同期クラウド | プロプライエタリ | GPT-5のみ | 並列サンドボックス | 制限あり | |
| 対話型ターミナル | Apache 2.0 | Geminiのみ | 制限あり | 1日1,000リクエスト | |
| 自己構築型 | Apache 2.0 | 任意のモデル | グラフ・オーケストレーション | フレームワーク無料 |
SWE-benchのパフォーマンス
SWE-bench Verified
Terminal-Bench 2.0
トークン数(少ないほど軽量)

SWE-benchおよびTerminal-Benchのスコアは、ベースとなるモデル(Claude Opus 4.7、GPT-5.5、Gemini 2.5 Pro)を反映しています。Piのスコアはモデル依存です — 任意のプロバイダーで動作します。システムプロンプトのサイズ: mariozechner.at(2025年11月)によるとPiは1,000未満、Claude Codeは約10,000です。出典: Anthropicシステムカード · Piブログ記事。
適切なフレームワークを選ぶ
コンプライアンス・監査証跡・サブエージェント制御を必要とするエージェントチーム
Claude Code + Agent SDKをご利用ください — 権限管理されたツールセットを備えた本格的なサブエージェントサポート、変更管理ログ用のPreToolUse/PostToolUseフック、プランモード(読み取り専用)、セッション分岐機能を備えています。対話型CLIをそのまま反映したプログラマブルAPIを持つ唯一のフレームワークです。完全な可観測性が求められる規制対応・マルチエージェント・ワークフローに最適です。
バックグラウンド・タスクキュー — タスクを投げてPRを回収
Codexをご利用ください — 非同期・並列のクラウド実行向けに構築された唯一のフレームワークです。複数のリポジトリにまたがる20個のタスクを同時に投入でき、それぞれが分離されたサンドボックスで実行され、PRを返します。実際のソフトウェア・エンジニアリング・タスクでRL(強化学習)を行い、人間らしくクリーンな差分を生成します。チームが他の作業を進めている間に、エージェントをバックグラウンドで稼働させたい場合に最適です。
コスト重視・ローカル・エアギャップ環境への導入
Piをご利用ください — MITライセンス、モデル非依存(Anthropic、OpenAI、Gemini、Mistral、Ollama、他多数)で、1,000トークン未満のシステムプロンプトにより、コンテキストのオーバーヘッドが他選択肢の約10分の1で済みます。フォーク・組込・Ollamaを使った完全オフライン実行が可能です。データ主権が重要、予算が限られている、あるいはフレームワーク自体を完全にコントロールする必要がある場合に最適です。
Google Cloud上でのカスタム・マルチエージェント・システム
Google ADKをご利用ください — グラフベースの本格的なエージェント・オーケストレーション・フレームワーク(Python、TypeScript、Go、Java)で、100以上のエンタープライズ・コネクタ(SAP、Salesforce、Workday、BigQuery)、A2A(エージェント間)通信プロトコル、Vertex AIへのネイティブ・デプロイを備えています。既存のエンタープライズ・システム統合を伴うGCP上のオーダーメイド・エージェント・ワークフローを構築する場合に最適です。