Stability AI⁠商用利用できる日本語画像言語特徴抽出モデル「Japanese Stable CLIP」リリース

Stability AIは2023年11月15日、商用利用可能な日本語画像言語特徴抽出モデル「Japanese Stable CLIP」をリリースした。

「Japanese Stable CLIP」は、日本らしい画像や日本語に特化した画像言語特徴抽出モデル。任意の日本語テキストから画像を検索する画像検索や、その逆であるテキスト検索が可能。また「Japanese Stable CLIP」をモデルの一部として利用することで、日本語テキストと画像に特化したマルチモーダルなタスクへの拡張が可能となる。

「Japanese Stable CLIP」の学習には、言語画像事前トレーニングSigLIPの手法を用いており、オープンソースの日本語対応CLIPモデルの中で、最も高い性能評価スコアを達成しているという。

「Japanese Stable CLIP」Hugging Faceにて公開されている。また、⁠Japanese Stable CLIP」を使って入力画像から職業を判断するテキスト分類のデモがGoogle Colab上で公開中

おすすめ記事

記事・ニュース一覧