OpenAIは2025年10月6日、OpenAI Platform上でAIエージェントを構築、デプロイ、最適化するためのツールキット
Introducing AgentKit—build, deploy, and optimize agentic workflows.
— OpenAI Developers (@OpenAIDevs) October 6, 2025
💬 ChatKit: Embeddable, customizable chat UI
👷 Agent Builder: WYSIWYG workflow creator
🛤️ Guardrails: Safety screening for inputs/outputs
⚖️ Evals: Datasets, trace grading, auto-prompt optimization pic.twitter. com/ pGgNHKOvj3
これまで、AIエージェントの構築はバージョン管理のない複雑なオーケストレーション、カスタムコネクタ、手動評価パイプライン、プロンプトの調整、長時間のフロントエンド作業の組み合わせを必要としていた。AgentKitを使用すると、開発者はワークフローを視覚的に設計し、新しいビルディングブロックを使用してエージェントUIをより迅速に組み込むことができるようになる。
AgentKitは以下のようなモジュールで構成されている。
- Agent Builder
- エージェントワークフローをビジュアルで作成できるツール。ドラッグ&ドロップで各ノードを操作したり、ツールの接続、Guardrailsや評価設定といった他のモジュールの配置やバージョン管理などもGUI上で視覚的に構成できる。

- Guardrails
- エージェントを意図しない動作や悪意のある動作から保護するオープンソースのモジュール型セーフティレイヤ。個人情報
(PII) のマスキングやフラグ付け、ジェイルブレイクの検出、その他の安全対策をエージェントに適用できる。PythonおよびJavaScript用のライブラリも用意されている。 - ChatKit
- エージェントにチャットUIを組み込むことがきる。ストリーミングレスポンスの処理、スレッドの管理、モデル思考過程の表示、チャットエクスペリエンスの設計などをプロダクトに合わせ、チャットベースのエージェントを簡単に構築できる。ChatKit StudioというサイトでChatKitのカスタマイズオプションやウィジェットの配布、ChatKitのデモを見ることができる。
- 新しい評価
(Evals) 機能 - 開発者がプロンプトをテストしモデルの動作を測定、パフォーマンス評価できるEvals機能が強化され、以下の4つの機能が追加された。
-
- データセット:エージェント評価をゼロから構築、自動採点と人によるアノテーションを使用して徐々に拡張可能に
- トレース評価:エージェントワークフローのエンドツーエンド評価を実行し、採点を自動化して問題点を特定
- 自動プロンプト最適化:人によるアノテーションと採点結果に基づいて、改善されたプロンプトを生成
- サードパーティモデルのサポート:OpenAI Evalsプラットフォーム内で、他のプロバイダーのモデルを評価可能に
- Connector Registry
- 開発の管理者がOpenAI製品間でデータとツールの接続方法を一元管理できるレジストリ。複数のワークスペースや組織にまたがるデータの管理、維持を行えるよう、単一の管理パネルでChatGPTとAPI全体のデータソースを扱うことができるほか、Dropbox、Google Drive、SharePoint、Microsoft Teamsなどの既成コネクタやサードパーティのMCPも管理できる。
さらに、Reinforcement Fine-tuning
今回発表となったAgentKitのうち、ChatKitと新しいEvals機能はすべての開発者に一般公開されており、Agent Builderはベータ版で利用が可能。Connector RegistryはAPI、ChatGPT Enterprise、Eduの一部の顧客を対象に、Global Admin Consoleの機能としてベータ版のロールアウトが始まっている。これらのツールはすべて標準APIモデルの料金に含まれている。
AgentKitを使った実例も紹介されている。たとえば米国の大手スーパーマーケットチェーンのAlbertsonsでは、AgentKitを使って従業員がアイスクリームの売上向計画の作成を依頼できるエージェントを開発した。
@Albertsons used AgentKit to build an agent.
— OpenAI Developers (@OpenAIDevs) October 6, 2025
An associate can ask it to create a plan to improve ice cream sales. The agent looks at the full context — seasonality, historical trends, external factors — and gives a recommendation. pic.twitter. com/ rak7G5qc5U
このほか日本のLINEヤフーでは、Agent Builderを用いて2時間未満で作業アシスタントエージェントを構築したという。