Google⁠画像生成モデル「Nano Banana Pro」リリース

Googleは2025年11月20日、画像生成モデル「Nano Banana」の上位版として、Gemini 3 Proを基にした「Nano Banana Pro(Gemini 3 Pro Image⁠⁠」を発表した。

従来のNano Banana(Gemini 2.5 Flash Image)が高速で気軽に画像を生成できるモデルであったのに対し、Nano Banana Proは、より複雑で高品質な画像制作に対応するモデルとなっている。アスペクト比は1:1から9:16まで対応し、高解像度となる1K・2K・4Kの画像を生成できる。

アイデアやデザインを視覚化する用途にも適している。インフォグラフィックの作成、手書きメモの図解化において、画像内のテキストを正確に描画する能力が強化されている。また、多言語でのテキスト生成や、既存の画像内テキストの翻訳も可能になっている。

日本語のテキスト描写、文化理解、細部の表現、スタイル変換も大幅に強化されている。

複雑なマルチターンでの生成・変更タスクや、難易度の高いワークフローでは、モデルはすぐに最終画像を出力するのではなく、まずプロンプトを推論しながら構図を試す中間的な「思考画像」⁠thinking images)をサーバー側で生成する。この思考画像はユーザーには表示されない。こうして決まった構図や内容をもとに、最終的な高品質の画像を出力するという。この仕組みにより、生成される画像が安定した品質になるとしている。

さらにGemini 3の知識やGoogle検索とのグラウンディングを組み合わせることで、レシピの「スナップショット」や、天気・スポーツといったリアルタイム情報の可視化、事実に基づいた図やインフォグラフィックなどを生成できるようになっている。

画像合成と一貫性の面では、最大14枚までの入力画像を組み合わせることができ、また最大5人の人物の特徴や類似性を保ったまま、1つの高精細なビジュアルに統合できる。このことは製品画像やロゴ、参考画像など多様な要素を組み合わせて一貫した広告クリエイティブを作成する場合にも有用で、複数の写真を1つのプロンプトでシームレスに組み合わせることができるようになる。

編集機能では、画像内の特定の領域だけを精密に編集・変形できるローカル編集機能が強化されている。ライティング、カメラ、フォーカス、カラーグレーディングといった「物理」や構図を細かく制御し、プロフェッショナル品質の出力を得られるとのこと。


Nano Banana Proは本日より各種Google製品・サービスに順次展開されている。

Geminiアプリでは、⁠🍌画像を作成」「Thinking」を選択することでNano Banana Proを利用できる。無料ユーザーには無償の利用枠が限定的に(数回)提供され、その上限を超えるとNano Bananaが使われるGeminiアプリでは、画像のプレビューは1K解像度で、ダウンロードは2K解像度とされている⁠。

米国のGoogle AI Pro/Ultraユーザー向けだが、Google検索のAIモードでもNano Banana Proが利用されるようになる。

NotebookLMでは今回のNano Banana Proの提供にあわせて、新たに2種類の出力機能を追加した。1つは「Infographics」で、ソースをもとにカスタマイズ可能かつ高品質なビジュアル要約を生成する。これによって、テキスト中心のソースを見た目にも分かりやすいインフォグラフィックとして可視化できる。2つ目は「Slide Decks」であり、元のソースを「じっくり読むための詳細なデッキ」または「プレゼンテーション用スライド一式」に変換する。スライドはカスタマイズ可能で、難解な資料の整理だけでなく、長い筆算の例を「壮大なクエスト」に変換したり、履歴書やLinkedInをアップロードしてキャリアを視覚的に表現できるという。これらの新機能はProユーザー向けにはすでに提供済みで、無料ユーザーにも今後数週間以内に順次展開される予定。

Google Adsでは画像生成機能がNano Banana Proになった。Google WorkspaceのスライドとVidsにも段階的に提供される予定。

開発者およびエンタープライズ向けにはGemini APIを通じて提供され、Google AI StudioおよびVertex AIでも展開が始まっている。またエージェント開発プラットフォーム「Google Antigravity」では、コーディングエージェントがNano Banana Proの画像生成機能を直接活用できる。これによって、確認用のUIモックアップや、新たなビジュアルアセットをコード実装前に生成することが可能になる。

映像制作のクリエイター向けにはFlowにおいて、Google AI Ultraユーザー向けにNano Banana Proが段階的に提供開始されている。これによって各フレームやシーンに対してさらに高い精度での制御がおこなえるという。


無料ユーザーおよびGoogle AI Proのユーザーが生成した画像には、目に見える透かしとして「Gemini sparkle」を表示し、画像がGoogleのAIツールによって生成されたものであることが示される。一方で、プロフェッショナル用途においてこの透かしを避けたいといった必要性を踏まえ、Google AI UltraおよびGoogle AI Studioのツール内で生成される画像ではこの透かしを非表示にできる。

なおGoogleのツールで生成または編集された画像には、デジタル透かし「SynthID」が目に見えない形で埋め込まれている。

今回、Geminiアプリ内でAI生成画像かどうかを直接検証できる機能を追加した。Geminiアプリに画像をアップロードし、⁠Was this created with Google AI?(これはGoogle AIで生成されましたか?⁠⁠」や「Is this AI-generated?(これはAIによって生成されたもの?⁠⁠」といった質問をおこなうだけで可能になったという(ブログのデモを見ると、Thinking(Gemini 3)を選ぶ必要がありそうだ⁠⁠。

またGeminiアプリやVertex AI、Google Adsで生成されるNano Banana Pro画像に対して、C2PAメタデータを埋め込む対応を今週から段階的に開始している。これによって、画像生成に関する追加情報を画像ファイルから得られるようになる。今後数か月で、より多くの製品やサービスへ拡大していく予定。さらに、C2PA(コンテンツクレデンシャル)を用いた検証も計画している。この検証の拡大によってGoogleのAIツール以外で生成された画像などのコンテンツについても、その出所を確認できるようにすることを考えているという。


Googleは同日付で、Nano Banana Proを活用するためのプロンプト設計と利用上のポイントも紹介している。概要は以下のとおり。

プロンプトに含めるべき推奨要素として、以下の要素を挙げている。

  • 誰/何を描くか(Subject)
  • 構図(Composition)
  • 何が起きているか(Action)
  • 場所(Location)
  • 全体のスタイル(Style)
  • 既存画像を編集する際の具体的な指示(Editing Instructions)

また詳細指定のコツとして、以下の事柄を具体的に書き分けることを挙げている。

  • 縦横比やキャンバスサイズといったアスペクト比
  • カメラアングルや被写界深度
  • ライティングやカラーグレーディングなどの撮影条件
  • 画像内に表示するテキストの内容・配置・書体、図解などにおける事実の正確さ
  • アップロードした各参照画像の役割(ポーズ、画風、背景など)

ブログではさらに、7つの活用パターンが紹介されている。

  • 高精度なテキストレンダリングを生かしたポスターや図解、プロダクトモックアップの作成
  • Gemini 3 Proの持つ知識と推論力を活用した精緻なビジュアル生成
  • 画像内テキストの翻訳による多言語展開
  • ライティングやカメラ、フォーカス、カラーグレーディングなどを直接指定した編集
  • 1K・2K・4Kといった解像度や多様なアスペクト比でのリサイズ
  • シーン別に6〜14枚の画像をブレンドしつつ複数キャラクターの一貫性の保持
  • 3Dオブジェクトやパッケージに、パターンやロゴ、アートワークを自然な質感でのマッピング

注意事項として、小さな文字や細部の描画・つづりの正確さが完璧ではないこと、図解やインフォグラフィックでは検証が必要なこと、多言語テキスト生成では文法ミスや意図と異なることが起こり得ること、複雑な編集や高度なブレンドでは不自然なアーティファクトが生成される場合があること、キャラクターの特徴や一貫性も状況によっては揺らぎが生じることが言及されている。

おすすめ記事

記事・ニュース一覧