OpenAI、推論モデルシリーズの最新版、o3プレビューの性能評価を発表 ——o1を大幅に上回る性能を達成。モデルの安全性を向上する技術も紹介

OpenAIは12月21日、推論モデルoシリーズの最新版、o3の初期バージョン（プレビュー）の性能評価を発表した [1]。o3は、コーディング、数学、科学的推論に関して既存モデルであるo1を大幅に上回ることを各種ベンチマークを用いて示している。

Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.twitter.com/e4dQWdLbAD
— OpenAI (@OpenAI) December 20, 2024

9月に発表した推論モデルo1は、「⁠Learning to Reason with LLMs」で言及されているように強化学習でトレーニングされた言語モデルだった。o3はその強化学習をさらにスケールアップすることで実現できた言語モデルだという。

o3は未学習の最近のプログラミングコンテストや数学テストにおいて、o1を大幅に上回る性能を得たことが語られている。特に、AIと人間の知能を比較する指標の一つとして作られたARC-AGIの評価でも大きな飛躍が得られたとのこと。

New verified ARC-AGI-Pub SoTA!@OpenAI o3 has scored a breakthrough 75.7% on the ARC-AGI Semi-Private Evaluation.

And a high-compute o3 configuration (not eligible for ARC-AGI-Pub) scored 87.5% on the Semi-Private Eval.

1/4 pic.twitter.com/uQA47JWkl6
— ARC Prize (@arcprize) December 20, 2024

また、より高速で安価なモデルのo3-miniもあわせて発表している。コーディングに最適化されているとし、o3シリーズとしては最初（2025年初頭）に一般提供される予定。

そして、性能がo3クラスのモデルの安全性を向上するために、新しい手法「Deliberative Alignment」についても取り上げて紹介している。Deliberative Alignmentでは、モデルに安全仕様書（safety specifications）のテキストを直接教え、推論時にその仕様について熟慮するようにモデルをトレーニングするアプローチを取る。これにより、モデルの堅牢性と安全性を大幅に向上できるという。

現在OpenAIでは、o3/o3-miniの一般提供前に、言語モデルの安全性を研究している人に対して、テストの協力を求めている。

o3 represents enormous progress in general-domain reasoning with RL — excited that we were able to announce some results today! Here’s a summary of what we shared about o3 in the livestream (1/n) pic.twitter.com/xq7RXZtleJ
— Nat McAleese (@__nmca__) December 20, 2024