2025年11月にGoogleからリリースされた最新画像生成モデル、通称「Nano Banana（ナノバナナ）」こと gemini-3-pro-image-preview。

皆さんはもう試されましたか？

界隈では「文字描写が正確すぎる」「推論能力が段違い」と話題ですが、APIとして自社プロダクトに組み込む際や、本当に狙った通りの画像を出すには、従来のStable DiffusionやMidjourneyとは少し違った「コツ」が必要です。

今回は、現在開発中のSaaS検証で得た知見をもとに、Nano Banana Pro APIで最高品質の画像を生成するためのプロンプト設計と実装テクニックを解説します。

Nano Banana Pro (Gemini 3 Pro Image) とは？

まずは基本スペックのおさらいです。

モデルID: gemini-3-pro-image-preview
最大解像度: 4K相当
強み: 複雑なプロンプトの理解、日本語テキストの正確な描画、キャラクターの一貫性保持

これまでの画像生成AIが「呪文（単語の羅列）」で絵を出していたのに対し、このモデルは「指示を論理的に理解して描画する」能力に長けています。

つまり、プロンプトエンジニアリングの質がダイレクトに画像の品質に直結します。

高品質な画像を出すプロンプトの3つの鉄則

Nano Banana Proのポテンシャルを引き出すには、以下の3点を意識してください。

1. 「SALS」フレームワークで構造化する

曖昧な文章よりも、要素を分解して伝えると精度が劇的に向上します。

私は「SALS（サルス）」と呼んで意識しています。

S (Subject/被写体): 誰が、何が（例：20代日本人女性、ショートボブ、白いリネンシャツ）
A (Action/行動): 何をしているか（例：カフェでMacBookを開いてタイピングしている、視線は画面）
L (Location/場所・光): どこで、どんな光か（例：表参道のオープンテラス、午後の柔らかい自然光、背景はボケている）
S (Style/スタイル): 画風・質感（例：フォトリアリスティック、85mmレンズ、4K高解像度、シネマティックライティング）

悪い例：

「カフェでパソコンしている女性、きれいな写真」

良い例（Nano Banana向け）：

「表参道のカフェのテラス席で、MacBookを開いて真剣に作業をしている20代の日本人女性。午後3時の自然光が横から当たり、髪の毛の質感が詳細に描写されている。背景の街並みは被写界深度が浅くボケており、フォトリアリスティックな4K写真。」

2. 文字描写は「カギカッコ」で指定

このモデルの最大の武器は、画像内に違和感なく文字を入れられる点です。コツは、描画させたい文字を 「」 や "" で明確に囲み、配置場所を指定することです。

プロンプト例： 近未来的なサイバーパンクな日本の街並み。ネオンサイン看板に「AI活用」という文字が青く光っている。看板は建物の2階部分に設置されている。

3. ネガティブプロンプトより「ポジティブな詳細」を

Stable Diffusionでは「低品質を描かないで」というネガティブプロンプトが重要でしたが、Gemini系モデルは「何を描くか」を詳細に説明する方が品質が上がります。

特に「Lighting（照明）」と「Texture（質感）」の語彙を増やすと、画像が一気にプロっぽくなります。

Cinematic lighting （映画のような照明）
Rembrandt lighting （レンブラントライト/陰影）
Highly detailed skin texture （詳細な肌の質感）

PythonでのAPI実装テクニック

高品質な画像をアプリに組み込むための、最小構成のコード例を紹介します。ここでは google-genai SDKを使用します。

基本の実装コード

from google import genai
from google.genai import types
import os

# APIキーの設定
client = genai.Client(api_key=os.environ.get("GOOGLE_API_KEY"))

def generate_high_quality_image():
    response = client.models.generate_image(
        model='gemini-3-pro-image-preview',
        prompt='朝日で輝くモダンな美容室の店内、木目調のインテリア、大きな鏡、4K高解像度、広角レンズ',
        config=types.GenerateImageConfig(
            aspect_ratio="16:9", # ブログや動画サムネなら16:9
            number_of_images=1,
            # 安全性設定（商用利用の場合は調整が必要なケースあり）
            safety_settings=[
                types.SafetySetting(
                    category="HARM_CATEGORY_SEXUALLY_EXPLICIT",
                    threshold="BLOCK_ONLY_HIGH"
                )
            ]
        )
    )

    # 画像の保存
    if response.generated_images:
        image = response.generated_images[0].image
        image.save("result_image.png")
        print("画像生成完了！")
    else:
        print("生成に失敗しました")

if __name__ == "__main__":
    generate_high_quality_image()

開発者向けのポイント

aspect_ratio: デフォルトは1:1ですが、Web素材なら 16:9、スマホアプリなら 9:16 を明示的に指定しましょう。
reference_images (応用): ここでは割愛しましたが、特定のキャラクターやスタイルを維持したい場合、参照画像を渡すことで一貫性を持たせることができます。これはSaaS開発において非常に強力な機能です。

まとめ：AIは「指示出し」が9割

Nano Banana Pro APIは、エンジニアにとってもクリエイターにとっても強力なツールです。

SALSフレームワークで構造的に指示する
文字入れを活用してデザイン工数を削減する
APIパラメータでアスペクト比や安全性を制御する

これらを意識するだけで、生成される画像のクオリティは格段に上がります。現在開発中の美容室向けSaaSでも、この技術を応用して「スタイルの提案」機能の実装を進めています。

皆さんのプロダクト開発の参考になれば幸いです。

Nano Banana Pro API (Gemini 3 Pro) で高品質な画像を生成するプロンプトの極意 & 実装ガイド