Stability AI⁠Stable Diffusion 3.5をリリース

Stability AIは2024年10月22日、同社が開発する画像生成AIモデルStable Diffusionの新バージョンStable Diffusion 3.5を発表した。

Stable Diffusion 3.5は、6月に公開したStable Diffusion 3 Mediumに対するコミュニティのフィードバックを受け強化したもので、モデルのトレーニングプロセスを改善し、さらにファインチューニングや開発を簡素化したという。モデルはファインチューニングやカスタマイズが可能でアプリケーションに組み込むのも比較的容易なほか、コンシューマ向けの標準的なハードウェアで高負荷をかけずに実行できるように最適化されている。

また多様な指示を必要とせず、さまざまな肌の色や特徴を持つような画像を作成でき、3D、写真、絵画、線画など多彩なスタイルで精細なグラフィックを生成することが可能となっている。

Stable Diffusion 3.5による生成画像の例
プロンプト:背中に幻想的な都市をもつ古い巨大な亀がいる情景。亀の甲羅は木々がそびえ立ち緑が生い茂る深い森に覆われ、木々の葉の間から霧に包まれ隠れた村がある。都市は自然な環境に溶け込むように最適にデザインされた建物で構成され、各地区を結ぶロープ製の吊り橋が特徴。
Stable Diffusion 3.5による生成画像の例

今回リリースされるのは以下の3モデル。

Stable Diffusion 3.5 Large
Stable Diffusion 3.5の基本モデル。80億のパラメータ数をもつ。はるかに大きなパラメータ数をもつ競合モデルに並ぶ画像品質が得られるという。
Stable Diffusion 3.5 Large Turbo
Stable Diffusion 3.5 Largeモデルの高速動作版。4ステップで高品質な画像を生成できる。
Stable Diffusion 3.5 Medium
26億パラメータの軽量モデル。アーキテクチャとトレーニング方法を改良し、カスタマイズのしやすさと画質を両立。コンシューマー向けハードウェアで「箱から出してすぐに使える」ように設計されているとのこと。⁠10月29日リリース予定)

Stable Diffusion 3.5 LargeおよびStable Diffusion 3.5 Large Turboはセルフホスティング用のモデルをHugging Faceからダウンロードでき、GitHubから推論コードも入手可能。またStable Diffusion 3に続いてAPI利用も可能となっている。

またいずれもStability AI Community Licenseに準拠しており、非営利もしくは年間収益100万USドル未満の企業/個人による商用利用は無料。

おすすめ記事

記事・ニュース一覧