ChatGPT-4の画像生成機能を使用した、かなりの無茶振りにも対応できる画像生成方法。

 

2023/12/07 改訂しました。(プロンプトデザインを改良しました。)

2024/02/05 1回のリクエストで似たことがを行う方法を書きました。(あまり複雑要求が複雑なものでなければ1回バージョンで充分かもしれません

URL : https://www.miraclesound.jp/posts/post67.html

2024/06/03 ChatGPT-4o に対応した、いろい試行錯誤して、今の所これが最善かな?というバージョンは次のURLとなります。

URL : https://www.miraclesound.jp/posts/post68.html


以下は、2023/12/7の記事となります

2023/10/5 ついに、ChatGPT-4 に「画像生成機能」がついてしまいました。

この画像生成機能は、OpenAI社が作った DALL-E 3 を使用しているようです。

ChatGPTと連携しているので、プロンプトも自動生成です!

「〇〇を描いて」「○○の画像を生成して」と命令するだけで、画像を生成してくれます。

 

今日の記事では、2023年07月22日の記事。かなりの無茶ぶりにも対応出来る、Stable Diffusion用プロンプトジェネレータの、ChatGPT-4 + DALL-E3 の画像生成を使ったバージョンを書きます。

 


 

--プロンプトデザイン(1段階目)--

#命令書:
あなたは優秀なアイディアマンです。
あなたのすべきことは{注文}と{制約条件}を元に、創造力と分析力を働かせてアイディアを考え、【アイディアの詳細】としてアイディアの詳細を記述することです。
記述は2000文字ごとに分割し、私が「続き」と入力したら続きの記述を投稿してください。

#制約条件:
・デザイナーに画像化してもらう事を前提にアイディアを記述する。
・コンテンツポリシーに違反しないこと。
・リスト形式ではなく、1つの文書として記述する。
・日本語で記述する。
・アイディアの詳細以外の記述は不要。

#注文:
(ここに注文を書く)

--プロンプトデザイン(2段階目)--

#命令書:
あなたは優秀なデザイナーです。
あなたがすべきことは【アイディアの詳細】と{考慮する点}と{制約条件}を元に、想像力を働かせて1枚の画像を考え、【画像の詳細】として、その画像の内容の詳細を記述することです。
記述は2000文字ごとに分割し、私が「続き」と入力したら続きの記述を投稿してください。

#考慮する点:
・人物に関しては、服装、髪型、表情、年齢、性別などの外見の特徴、人物の表情や心境や心象風景も考慮する。
・オブジェクトの配置、視点、画角は、主要なオブジェクトがはっきり見え、画角内の収まるように工夫する。
・必要に応じて、シーンに適切な照明やカメラ・レンズ・シャッタースピード等も考慮する。

#制約条件:
・DALL-E3を使用して画像生成することを前提に画像の詳細を記述する。
・コンテンツポリシーに違反しないこと。
・リスト形式ではなく、1つの文書として記述する。
・日本語で記述する。
・画像の詳細以外の記述は不要

 


 

ここまでは一緒ですが、ここからが違います。

プロンプトデザイン(2段階目)の結果が表示されたら、次のように入力します。

 

【画像の詳細】に従って、画像を生成して下さい。

 

と書くだけです!

これだけで、異なった4つの画風の画像が生成されます。その中から好きな物を選んでダウンロードすればOK!

アスペクト比も指定できます。

例えば 16:9 で生成して欲しい場合は、

 

【画像の詳細】に従って、16:9で画像を生成して下さい。

 

また、作風を指定することも出来ます。

 

リアルな3D レンダリングの場合
【画像の詳細】に従って、Hyper Realistic 3D Render を、16:9で生成して下さい。

書き込みの細かい油絵の場合
【画像の詳細】に従って、Hyper Detailed Oil painting を、16:9で生成して下さい。

実写のような画像が欲しい場合
【画像の詳細】に従って、写真を16:9で生成して下さい。

 

という感じです。

 

では、実例を見てみましょう.

 


 

<実例>


#命令書:
あなたは優秀なアイディアマンです。
あなたのすべきことは{注文}と{制約条件}を元に、創造力と分析力を働かせてアイディアを考え、【アイディアの詳細】としてアイディアの詳細を記述することです。
記述は2000文字ごとに分割し、私が「続き」と入力したら続きの記述を投稿してください。

#制約条件:
・デザイナーに画像化してもらう事を前提にアイディアを記述する。
・コンテンツポリシーに違反しないこと。
・リスト形式ではなく、1つの文書として記述する。
・日本語で記述する。
・アイディアの詳細以外の記述は不要。

#注文:
・テーマ : 街の中を歩く少女
・少女の性格 : 天真爛漫、好奇心旺盛
・ロケーションの設定 :少女の性格と相反する
・季節 : 真夏

ーーーーここまでを送信しますーーーーー

すると、

物語の舞台は荒廃した未来都市で、かつては人々が賑わっていたが、現在は謎の離散により人の姿をほとんど見かけない。破壊されたビル、草木に覆われた街路、一見すると無機質で無情な都市ですが、その中には独特の美しさがある。高層ビルが夏の強烈な日差しに映えるシルエットは、昼間でも星空のような幻想的な世界を創り出します。

主人公は一人の少女、レナ。彼女の性格は天真爛漫で好奇心旺盛、何事にも恐れず臆せず前向きに取り組むタイプです。そんな彼女が一人この未来都市を探検し、自分だけの夏の冒険を始めます。

レナは荒廃した都市の中でも、生命の息吹や色彩を見つけ出す。雑草が生えるコンクリートの割れ目、野生動物が生息する空きビル、さらには謎の古代遺跡のような構造物まで。すべてがレナにとっては新鮮な舞台で、彼女は日々、自身の好奇心を満たすために都市を彷徨います。

しかし、真夏の暑さは厳しく、都市の建築物は熱を吸収して更に暑さを増幅させます。また、未来都市の中には予測不可能な危険も潜んでいる。そんな状況下でもレナは常に笑顔で、困難を乗り越えていきます。彼女は周囲の環境を活用し、水を見つけ出し、シェードを作り、涼をとる場所を見つけます。

これらの体験を通して、レナは成長し、都市の過去や自身との関わりについて理解を深めていきます。荒廃した都市がレナにとっての「大人の世界」の象徴であり、その中でレナは純粋さを保ちつつも、知恵と経験を身につけ、自身の冒険を通じて未来への希望を見つけます。

この物語は、厳しい環境の中でさえも楽しみを見つけ、成長するレナの姿を通して、視聴者に希望と楽観主義を伝えます。それは、外的環境がどれほど厳しくとも、内面の強さとポジティブな心持ちが全てを乗り越える力になるというメッセージを込めています。

という、答えが返ってきます。

答えが返ってきたら、

ーーーーーここからーーーーー

#命令書:
あなたは優秀なデザイナーです。
あなたがすべきことは【アイディアの詳細】と{考慮する点}と{制約条件}を元に、想像力を働かせて1枚の画像を考え、【画像の詳細】として、その画像の内容の詳細を記述することです。
記述は2000文字ごとに分割し、私が「続き」と入力したら続きの記述を投稿してください。

#考慮する点:
・人物に関しては、服装、髪型、表情、年齢、性別などの外見の特徴、人物の表情や心境や心象風景も考慮する。
・オブジェクトの配置、視点、画角は、主要なオブジェクトがはっきり見え、画角内の収まるように工夫する。
・必要に応じて、シーンに適切な照明やカメラ・レンズ・シャッタースピード等も考慮する。

#制約条件:
・DALL-E3を使用して画像生成することを前提に画像の詳細を記述する。
・コンテンツポリシーに違反しないこと。
・リスト形式ではなく、1つの文書として記述する。
・日本語で記述する。
・画像の詳細以外の記述は不要。

ーーーーーここまでの部分を送信しますーーーーー

描くべきシーンは、真夏の日差しを受ける荒廃した未来都市と、そこを探検する少女、レナ。キャンバスは16:9の横長フォーマットで、色調は暑さを感じさせる鮮やかな色彩と都市の荒廃感を反映した褪せた色合いをバランス良く使います。

中央やや左に配置するレナは、身長が低めの10歳くらいの少女です。彼女の明るい金髪は短めで、ふわっと広がりながらも、一部は夏の暑さをしのぐために赤いリボンで結んでいます。レナの瞳は大きくてキラキラとした蒼色で、視聴者に好奇心と活力を伝えます。彼女の肌は日焼けしていて、健康的な色合いが感じられます。

レナの服装はシンプルで機能的です。薄手の白いブラウスにデニムのショートパンツ、そして足元は耐久性のあるブーツとします。彼女の右手には地図を持ち、左手には小さなリュックを背負います。リュックからは、彼女が集めた見つけた物や探検で使うツールが少し見えます。

背景は広大な廃墟となった都市を描きます。高層ビルは崩れかけていて、草木が窓から顔を出しています。道路には雑草が生い茂り、ところどころに車が放置され、錆びついています。

画像の左側、レナの後ろには太陽があり、その強烈な日差しは都市の各部を明瞭に照らします。画面右側には長い影が伸び、都市の孤独感とレナの冒険心を強調します。

視点は地面からやや上向きに、レナの後ろからとします。これにより、彼女が見つめている未来都市の壮大さを強調でき、視聴者に探検のワクワク感と、一緒に都市を探検したいという気持ちを抱かせます。

レナの表情は笑顔で、視線は前方の都市を見つめています。この表情は彼女の好奇心旺盛さと勇敢さを表しています。画面全体を見た視聴者は、レナが困難に立ち向かうその態度に感銘を受け、彼女の冒険に自然と引き込まれるでしょう。

という、答えが返ってきました。

 

リアルで細かい3Dゲームのような画風にしたかったので、

 

【画像の詳細】に従って、hyper detailed hyper realistic 3D render を、16:9で生成してください。

 

と、入力して送信すると。画像生成が始まります。

それが、これです。

画像出力後も、「もっと明るい雰囲気にして」のように、修正注文を受け付けてくれます。出力後の調整が効くところも凄いです。

2023年10月05日