OpenAI⁠動画生成モデル「Sora 2」ソーシャルアプリ「Sora」発表

OpenAIは2025年9月30日、動画生成モデルSora 2を発表し、同モデルを使える新しいソーシャルアプリSoraのiOS向けの提供とそ段階的利用を米国とカナダで開始した。

Soraは、動画(と音声)を生成するOpenAIのフラグシップモデルと位置付けられている。2024年2月に登場したSora 1が動画におけるGPT‑1だとすると、大規模な動画データを用いた事前学習と事後学習を経て作られたSora 2はGPT‑3.5相当に飛躍したものだと紹介した。ただし言語の学習と比べてしまうと、動画についてはまだ初期段階であるとも述べている。

Sora 2では、複雑な運動・物理的挙動を生成する能力が強化された。前のモデルはプロンプトに従うために物体の形状や物事の状況を不自然に歪めることがあったのに対し、Sora 2は現実で起こりえる物理現象をきちんと描写する傾向が強まっている。依然として間違いが起きるものの、無理に成功した結果を捏造することがなくなるよう、より現実的になっているという。

制御性も向上した。複数ショットにまたがる複雑な指示に従いながら、世界状態(World State)を保持でき、写実的、映画的、アニメ的のスタイルで高品質な生成をおこなえるようになった。

音声面では、汎用的な動画用の音声が生成できる。生成される動画の映像(口の動き・アクション・カット)に同期して、背景環境音・音声・効果音が生成される。

またSora 2では、現実要素の取り込み(カメオ機能)が可能になったことも特徴の一つとして挙げられる。自分や友人が外見と音声の短い動画をアプリで記録することで、その情報(ライクネス:外見と音声の特徴)をSoraの任意のシーンに高い忠実度で挿入できるようになった。

ユーザーはライクネス利用に関して、誰が利用できるかの許可指定、アクセス権の取り消し、ライクネスを含む動画の閲覧・削除を随時行える。初期展開では、公的人物や非同意人物の生成はおこなえず、カメオ機能以外の方法でライクネスを持ち込むことを禁止することで、非同意的利用およびな誤解を生むようなリスクを抑制する。

また不適切な使用を抑制するため、多層の保護機構を備えている。入力段階ではテキストや画像プロンプトを分類し高リスク要求を遮断し、出力段階では動画フレームと同期生成された音声を再スキャンして有害カテゴリ(性的・暴力・自己傷害・過激宣伝など)と判断した場合には生成されない。

なお、Soraで生成した動画には、目に見えるウォーターマークと、C2PAメタデータが加えられる。

詳細は、Sora 2のシステムカード責任あるSoraのリリースについてを参照のこと。

このSora 2を使える新しいソーシャルアプリSoraのiOS向けの提供も同時におこなわれており、その段階的利用を米国とカナダで開始した。Soraのアプリをダウンロードして、アプリにサインアップしたのち、アカウントのアクセスが可能になった時に通知される。一度アクセス権を得ると、ユーザーはSoraのサイトからもSora 2を使えるようになる。Androidユーザーは現状、すでにアクセス権を持つ人から招待コードを受け取った後、SoraのサイトでSora 2を使うかたちになる。

Soraアプリでは、動画の作成、ほかのユーザーが生成した動画のリミックス、カスタマイズ可能なSoraフィードで新しい動画を見つけることが可能になっている。上述のカメオ機能を使うと、アプリ内で簡単な動画と音声を一度録画して本人確認をおこなうことで、忠実にSoraのあらゆるシーンに自分を登場させることができる。OpenAIは、このカメオ機能を中心に構築されたソーシャルアプリこそが、Sora 2の魔法を体験する最良の方法だと考えているという。

フィードはデフォルトで、フォロー/インタラクション相手に偏るようになっていて、加えて創造インスピレーションとなる可能性が高い動画が優先して表示される。またフィードにもリスク保護機構が組み込まれており、定期的に簡単な状態確認を促すチェックがおこなわれる。利用者はチェックに応じて、フィードの表示傾向や通知頻度を調整できる。詳しくは、Soraのフィードのポリシーを参照のこと。

未成年の利用に対しては強力な保護措置が講じられる(ユーザーの年齢が不明の場合には未成年扱いされる⁠⁠。未成年に不適切とされるコンテンツへのアクセスを機械的に制限するフィルタリングが適用され、フィード閲覧の連続スクロールにも上限が設けられる。保護者は、ChatGPT経由で設定を管理できるペアレンタルコントロールも提供される。設定でパーソナライズの無効化、DMの制限、画像生成やカメオ権限の制限などが可能になっている。もし潜在的な自己傷害シグナルや重大なポリシー違反が検出された場合には、人間のモデレーションチームによる審査と対応がおこなわれる。未成年向けの保護施策については、9月29日に公開されたOpenAIのペアレンタルコントロール施策も参照のこと。

Sora 2は当分の間無料で提供され、寛容的な利用上限が設定される(10月3日追記:現在のところ1日あたり100回の生成が可能(10月1日時点)⁠。どの程度の期間無料で提供するかは計算資源の制約に左右されるという。またChatGPT Proユーザーの場合には、実験的ではあるが高品質なSora 2 Proへのアクセスが可能になることが記されている(10月3日追記:高品質で最大15秒までの動画を生成できるSora 2 Proが段階的提供が始まっている⁠。

APIでもSora 2をリリースする予定であることが触れられている。

※10月2日追記:次の内容を記載していましたが、Sora 1に対する仕様でした。お詫びいたします。なおSora - Billing FAQでは、ChatGPT Plus/Businessユーザーの場合には720pで最大5秒、または480pで最大10秒の動画が生成可能で、ChatGPT Proユーザーの場合には最大1080pで20秒の動画(目に見える透かしなし)が生成可能であることが案内されている。

おすすめ記事

記事・ニュース一覧