OpenAIは12月21日、推論モデルoシリーズの最新版、o3の初期バージョン
Today, we shared evals for an early version of the next model in our o-model reasoning series: OpenAI o3 pic.
— OpenAI (@OpenAI) December 20, 2024twitter. com/ e4dQWdLbAD
9月に発表した推論モデルo1は、
o3は未学習の最近のプログラミングコンテストや数学テストにおいて、o1を大幅に上回る性能を得たことが語られている。特に、AIと人間の知能を比較する指標の一つとして作られたARC-AGIの評価でも大きな飛躍が得られたとのこと。
New verified ARC-AGI-Pub SoTA!@OpenAI o3 has scored a breakthrough 75.
— ARC Prize (@arcprize) December 20, 20247% on the ARC-AGI Semi-Private Evaluation.
And a high-compute o3 configuration (not eligible for ARC-AGI-Pub) scored 87.5% on the Semi-Private Eval.
1/4 pic. twitter. com/ uQA47JWkl6
また、より高速で安価なモデルのo3-miniもあわせて発表している。コーディングに最適化されているとし、o3シリーズとしては最初
そして、性能がo3クラスのモデルの安全性を向上するために、新しい手法
現在OpenAIでは、o3/
o3 represents enormous progress in general-domain reasoning with RL — excited that we were able to announce some results today! Here’s a summary of what we shared about o3 in the livestream (1/
— Nat McAleese (@__nmca__) December 20, 2024n) pic. twitter. com/ xq7RXZtleJ