デジタル変革(DX)を学ぶ

2025.03.07 10:00

生成AI◎すぐに使える!プロンプトエンジニアリング講座/後編
画像生成への指示では“3つのコツ”を理解して使いこなせ!

 実践的なプロンプトにより生成AIの成果物の精度を高めるノウハウを解説する「プロンプトエンジニアリング講座」。前編ではテキスト生成におけるプロンプトの書き方を取り上げました。後編となる本稿では、画像生成AI向けのプロンプトエンジニアリングについて解説します。

 テキスト生成と画像生成では、同じ生成AIであってもプロンプト作成のコツが異なります。生成AIであることは同じなので前提は一緒ですが、求める成果物の性質が違うために細部が異なるなのです。

 本稿で扱う画像生成AIは、主にOpenAIのDALL-E 3(ダリ・スリー)ですが、プロンプトエンジニアリングのノウハウやコツは、どの画像生成AIでも同じです。本稿を通じて、さまざまな画像生成AI活用法の基礎を理解していきましょう。

(※)編集部注:プロンプトのノウハウに関連する用語としては、主に「プロンプトエンジニアリング」と「プロンプトマネジメント」があります。ほぼ同じ意味で用いられており、本稿ではより一般的な前者を使うこととします。

画像生成AIには2種類ある

 まず、理解するべきは「画像生成AIには2種類ある」ということです。具体的には、「対話型」と「非対話型」です。対話型生成AIの場合は、文字通り対話を通じて画像を生成していきます。代表的なモデルがChatGPTに搭載されたDALL-E 3であり、下記はDALL-E 3による画像生成プロセスの画面です。

2222
ChatGPTで画像を生成したところ。一度生成された画像に対して、修正を指示している

 対話型であるChatGPTでは、生成AIとのチャットを通じて、一度生成された画像を元にしての修正を行えます。

 しかし、非対話型の画像生成AI、例えばStable Diffusion(ステイブル・ディフージョン/*1)では、それができません。非対話型の画像生成AIで画像を修正する場合には、プロンプトを微調整して再度生成を試みることになります。
(*1)世界的に用いられている画像生成AI

3333
Stable Diffusionの操作画面。非対話型なので、生成AIが出力した画像に対してフィードバックできない。なお、プロンプトは英語での記述を基本とし、短いキーワードを「,」で区切って連続して書く

 画像生成AIで画像を生成するアプローチには、最初に叩き台となる画像を生成してから修正を繰り返す「反復型」と、条件を一度にまとめて提示する「単発型」があります(詳しくは「連載◎画像生成AI入門/第3回」参照)

 反復型アプローチをとれるのは、対話型画像生成AIだけです。非対話型生成AIの場合は、プロンプトの内容を都度修正して、単発型による生成を繰り返すイメージになります。

 こうした違いはありますが、対話型でも非対話型でも、基本となるプロンプトのコツは変わりません。以下、紹介していきましょう。

画像生成AIへのプロンプトにおける3つのコツ

 画像生成AIにおいてプロンプトを書く際のコツとしては、以下の3つのポイントを理解しておくことが大切です。

1. 可能な限り具体的に記述する
2. 基本条件を優先順位通りに並べて箇条書きにする
3. ネガティブプロンプトを記述する

1.可能な限り具体的に記述する

 テキスト生成AIに対する指示にも共通することですが、プロンプトの条件はできるだけ具体的に書きましょう。

 例えば、「日本人男性」というシンプルな情報に「38歳」と年齢を追記することで、具体性が増します。さらに、「怒った顔」などと表情の情報も付け加えれば、画像のイメージがより明確になっていきます。こうした形で、情報を増やしていきましょう。

2.基本条件を優先順位通りに並べて箇条書きにする

 「基本条件を優先順位通りに並べて箇条書きにする」というポイントは、画像生成AIへのプロンプトにおいて最も大事なコツといえます。ここでいう基本条件とはプロンプトに含めるべき要素のことで、5つあります。その5つを、以下の順番で箇条書きにしましょう。

①メインの被写体(人物、動物、物体、風景など)
②被写体の状態(表情、年齢、外観など)
③背景(場所、天気など)
④構図(顔のアップ、遠景など)
⑤描き方(アニメ風、水彩画風、浮世絵風、写真など)

 順番にこだわるのには理由があります。生成AIは、指示の冒頭にある情報を優先する傾向があるからです。画像生成において、最も重要なことは「被写体が何か」という情報ですから、これを最初に持っていくというわけです。

 「被写体の状態」という要素から下位の優先順位は一般的な並べ方を上に書きましたが、必要に応じて入れ替えても構いません。

 また、箇条書きにする理由は、文章形式のプロンプトと比べて生成AIが指示を理解しやすくなるとされているからです。特にプロンプトが長くなるような場合には、箇条書きにするのが鉄則となります。

 そして、条件は項目ごとに小分けにしましょう。例えば、被写体を「あご髭を生やした38歳の日本人男性」としたい場合、そのまま書くのではなく、「日本人男性」「年齢は38歳」「あご髭を生やしている」というように個々に分割してください。

 画像のイメージを明確に持てていない場合は、一度にすべての指示をするのは難しいでしょう。そのようなケースでは、前述した反復型のような感覚で、最初は少ない条件でたたき台の画像を生成してから、少しずつ条件を追加していく方法がお勧めです。最終的に5つの基本要素をすべて記述することを目標にして、生成を繰り返す中でイメージを固めていきます。

3.ネガティブプロンプトを記述する

 ネガティブプロンプトとは、画像生成AIに描いてほしくないものを指定したプロンプトのことです。以下の例を見てください。

 
・日本人男性
・38歳
・あご髭を生やしている
メガネをかけていない
・背景は会社のオフィス
・全身を描く
・写真のように描く
 

 上記の指示においては、「メガネをかけていない」という項目がネガティブプロンプトに該当します。

 テキスト生成におけるプロンプトエンジニアリングでは、「否定的よりも肯定的な指示がよい」と述べましたが、画像生成AIのプロンプトでは逆です。

 余談ですが、非対話型画像生成AI、例えばStable Diffusionでは、ネガティブプロンプト専用の入力欄が設けられています。ここには「low quality, out of focus, bad anatomy(*2)」などと記述するのがテンプレート化しています。
(*2)このプロンプトは、「低品質、ピントのボケ、おかしな人体構成」という意味。おかしな人体構成とは、人間の指の本数が6本ある、足が3本ある、といったような状況のこと

コツを踏まえたプロンプトの例

 ここまで解説してきた3つのコツを踏まえたプロンプトを用いて、実際に画像を生成してみましょう。先ほどは、「ネガティブプロンプト」の部分で人物に関するプロンプトを書いたので、風景とモノをDALL-E 3に生成させて見ましょう。

 

A.風景を描くプロンプト


以下の画像を出力してください。

・富士山
・夕焼け
・空には小さな雲が浮かんでいる
・遠景
・建物は描かない
・水彩画風に描く
 
4444

 上記のプロンプトを元にして、DALL-E 3が生成した画像です。ほぼプロンプト通りの富士山が描かれているのではないでしょうか。

 

B.モノを描くプロンプト


以下の画像を出力してください。

・一台のノートパソコン
・ノートパソコンのボディは黒色
・天板が白いデスクの上に置かれている
・背景は会社のオフィス
・パソコンの画面にはワープロソフトが表示されている
・ノートパソコン全体を描く
・人物は描かない
・写真のように描く
 
5555

 上記は、DALL-E 3が描いたモノの作例です。ノートPCが置かれたデスクの天板がやや肌色がかっている以外は、指示通りでしょう。

 これら2例で書いたプロンプトは特段細かいものではありませんが、一定の具体性があり、基本条件も優先順通りに並べられています。また、ネガティブプロンプトも記述されています。

 これから画像生成AIを活用するというユーザーは、このレベルの情報粒度の指示を出せるようになることを目標とするのがよいでしょう。ここまで記述できれば、それなりの精度で狙った画像を得られるようになります。

 そして、プロンプトを書くのに慣れてきたら、さらに細かい指示にもチャレンジしてみましょう。画像の生成精度が上がっていくにつれて、画像生成AIを使うことが楽しくなるはずです。

 
ここがポイント!
●生成AIで精度の高い画像を作成するために欠かせないポイントは3つある。
●画像生成AIへの指示は、可能な限り具体的に書く。
●5つの基本条件を優先順通りに箇条書きにして記述する。
●描いてほしくない要素がある場合は、ネガティブプロンプトを記述する。
一覧へもどる

BCN WEB会員は登録無料で情報満載!

無料会員のメリット

- Merit 1 -

企業向けIT活用事例情報のPDFデータをダウンロードし放題!

- Merit 2 -

本サイト「中小企業×DX」をはじめ、BCNのWEBメディア(「週刊BCN+」「BCN+R」など)の会員限定記事が読み放題!

- Merit 3 -

メールマガジンを毎日配信(土日祝を除く)※設定で変更可能

- Merit 4 -

イベント・セミナー情報の告知が可能!自社イベント・セミナーを無料でPRできる

- Merit 5 -

企業向けIT製品の活用事例の掲載が可能!自社製品の活用事例を無料でPRできる

登録時間 約1分
新規会員登録

無料会員登録で自社製品の事例をPR!

企業向けIT製品の活用(導入)事例情報を無料で登録可能!

「事例登録の流れ」はこちら

新規で会員登録される方は会員登録ページ、(すでに会員の方は、会員情報変更ページ)より、会員登録フォーム内の「ITベンダー登録」欄で「申請する」にチェックを入れてください。

未会員の方はこちら

登録時間 約1分
新規会員登録

会員特典 自社主催のセミナーをPRできる!

セミナー情報登録

デジタル活用・DX推進関連のセミナー・イベントを無料で告知することができます! 「中小企業×DX」が、貴社セミナー・イベントの集客をサポートします。

新規会員登録はこちら