OpenAI⁠エージェントを構築⁠デプロイ⁠最適化するツール「AgentKit」発表

OpenAIは2025年10月6日、OpenAI Platform上でAIエージェントを構築、デプロイ、最適化するためのツールキット「AgentKit」を発表した。

これまで、AIエージェントの構築はバージョン管理のない複雑なオーケストレーション、カスタムコネクタ、手動評価パイプライン、プロンプトの調整、長時間のフロントエンド作業の組み合わせを必要としていた。AgentKitを使用すると、開発者はワークフローを視覚的に設計し、新しいビルディングブロックを使用してエージェントUIをより迅速に組み込むことができるようになる。

AgentKitは以下のようなモジュールで構成されている。

Agent Builder
エージェントワークフローをビジュアルで作成できるツール。ドラッグ&ドロップで各ノードを操作したり、ツールの接続、Guardrailsや評価設定といった他のモジュールの配置やバージョン管理などもGUI上で視覚的に構成できる。
Agent Builder
Guardrails
エージェントを意図しない動作や悪意のある動作から保護するオープンソースのモジュール型セーフティレイヤ。個人情報(PII)のマスキングやフラグ付け、ジェイルブレイクの検出、その他の安全対策をエージェントに適用できる。PythonおよびJavaScript用のライブラリも用意されている。
ChatKit
エージェントにチャットUIを組み込むことがきる。ストリーミングレスポンスの処理、スレッドの管理、モデル思考過程の表示、チャットエクスペリエンスの設計などをプロダクトに合わせ、チャットベースのエージェントを簡単に構築できる。ChatKit StudioというサイトでChatKitのカスタマイズオプションやウィジェットの配布、ChatKitのデモを見ることができる。
新しい評価(Evals)機能
開発者がプロンプトをテストしモデルの動作を測定、パフォーマンス評価できるEvals機能が強化され、以下の4つの機能が追加された。
  • データセット:エージェント評価をゼロから構築、自動採点と人によるアノテーションを使用して徐々に拡張可能に
  • トレース評価:エージェントワークフローのエンドツーエンド評価を実行し、採点を自動化して問題点を特定
  • 自動プロンプト最適化:人によるアノテーションと採点結果に基づいて、改善されたプロンプトを生成
  • サードパーティモデルのサポート:OpenAI Evalsプラットフォーム内で、他のプロバイダーのモデルを評価可能に
Connector Registry
開発の管理者がOpenAI製品間でデータとツールの接続方法を一元管理できるレジストリ。複数のワークスペースや組織にまたがるデータの管理、維持を行えるよう、単一の管理パネルでChatGPTとAPI全体のデータソースを扱うことができるほか、Dropbox、Google Drive、SharePoint、Microsoft Teamsなどの既成コネクタやサードパーティのMCPも管理できる。

さらに、Reinforcement Fine-tuning(RFT)により、開発者は推論モデルをカスタマイズできるようになった。これによりエージェントのパフォーマンスが向上する。OpenAI o4-mini用のRFTはすでに一般公開されており、GPT-5には数十社のユーザー向けにプライベートベータ版として提供が開始されている。

今回発表となったAgentKitのうち、ChatKitと新しいEvals機能はすべての開発者に一般公開されており、Agent Builderはベータ版で利用が可能。Connector RegistryはAPI、ChatGPT Enterprise、Eduの一部の顧客を対象に、Global Admin Consoleの機能としてベータ版のロールアウトが始まっている。これらのツールはすべて標準APIモデルの料金に含まれている。

AgentKitを使った実例も紹介されている。たとえば米国の大手スーパーマーケットチェーンのAlbertsonsでは、AgentKitを使って従業員がアイスクリームの売上向計画の作成を依頼できるエージェントを開発した。

このほか日本のLINEヤフーでは、Agent Builderを用いて2時間未満で作業アシスタントエージェントを構築したという。

おすすめ記事

記事・ニュース一覧