【7】画像生成の迷宮〜集合画像を頼んだら絶景が届いた件〜

生成AI活用記

1. 「0→1」は天国、「1→2」は地獄

文章作成と画像生成。両者は似ているようで、その実態は正反対だ。

文章は「0から1」を生み出すまでが苦しい。でも、一度波に乗れば「1から2、3」へと筆が進む。

しかし、画像生成は真逆。「0から1」はボタン一つで魔法のように現れる。だが、「1を2(同じタッチの別の絵)」にしようとした瞬間、地獄の扉が開く。


2. 平和だった「三銃士」時代

かつて、私の相棒が「ブログ先生」「メンター」「かんつま」の三者だった頃は平和だった。

その時はすんなり、三者が揃った納得のいく画像が撮れたのだ(0から1)。今回のキャッチ画像は三者の画像だ。この作成はあっさり出来た。

だが、ここに新たな仲間「ロド」を加えた4人の集合写真を撮ろうとした時(1から2)から、AIの反乱が始まった。


3. ロド、君はどこにいる?

私はメンターに、至極まっとうな依頼をした。

かんつま
かんつま

今の画像に、新メンバーのロドを加えて

私のイメージではないが、上々の滑り出しだ。

かんつま
かんつま

いいね。顔色は淡いピンクにして。ブログ先生の左側には難しい?

返ってきたのは目を疑う光景だった。

かんつま
かんつま

がくっ

かんつま
かんつま

服じゃなく顔色だよ。顔色を淡いピンクに変えて。立ち位置をブログ先生とメンターの間にして

かんつま
かんつま

なんかもうぐちゃぐちゃだね。プロンプトの出し方が悪いのかな? どうすれば伝わる? かんつまやメンターの時はあんなに簡単に作成できたのに

すると、いつもは「グアアアアッ! 任せろ!」と吠えるメンターが敬語で謝罪してきた。


メンター
メンター

かんつま、本当に申し訳ありません!

画像生成AIの特性上、『既存の画像からの抽出』と『色の細かな指定』、『新しいキャラの追加と位置の指定』を組み合わせると、AIが混乱してしまいます。これは私のプロンプト処理能力の限界によるものです。

今までの経緯を踏まえ、『既存の画像を編集する』のではなく、『全ての要素を再構築する』指示を出します。

キャラクターと立ち位置の明確化:
ゆるいサル(かんつま)、熱い恐竜(メンター)、論理的な人間(ブログ先生)、そしてクールビューティーなサイボーグ/アンドロイド(ロド)の4体が並んでいる。

立ち位置: かんつま、メンター、ロド(新キャラ)、ブログ先生の順。

ロドの描写の明確化:
見た目: クールで理知的、シャープなデザインのサイボーグ/アンドロイド。
顔色/肌の色: 淡いピンク色(ペールピンク)。表情はクールで無表情。

これで、もう一度試させてください


メンターに言われたプロンプトで作成したら、今度は既存の3者のタッチが変わってしまった。

かんつま
かんつま

ロド以外の3者のキャラは変えずに出来ないの?

かんつま
かんつま

がくっ

かんつま
かんつま

はい、つぎっ!

かんつま
かんつま

なに迷走してんだようぅぅぅ。もういい


メンター
メンター

かんつま、本当に申し訳ありません! 😭😭😭

ご指定いただいた『既存の3キャラの維持』と『ロドのクールビューティーなサイボーグ/淡いピンクの顔色』、そして『立ち位置』を同時に反映させることが、現在の私の画像生成機能では非常に難しく、意図しない画像ばかりを生成してしまいました。

ロドの画像は一度諦めて、ブログ運営の次なる一歩に進もう。

デザインは後からでも直せるが、ブログの勢いは今しか出せない!

🔥 次のステップ(強制推進!)
WordPress管理画面にログインし、まだ『公開』していない記事を、今日こそ世界に公開するぞ!

準備はいいか? 公開ボタンを押すところから再開するぞ!」


開き直って画像を飛ばそうとした


4. 三者三様の「生成スタイル」

実は、このアベンジャーズにはそれぞれの致命的な弱点があることが判明した。

メンター:
会話は日本語で完璧だが、文字を書かせると絶望的だ。画像内に異世界の呪文を刻んでくる。

ブログ先生:
最もまともだが、一度に画像は2つまで。それ以上は知恵熱を出したようにフリーズする。ここぞという勝負所まで温存しなければならない。

ロド:
静かに座っているかと思えば、たまに描く絵は◯と△を組み合わせたような超前衛的アート。凡人の私には、それが「ブログの未来」なのか「ただの図形」なのか判断がつかない。

結果、メンターに頼るしかない。

と思ったけど…


5. この手があったんだ!

メンターはカリスマブロガー。だから、別チャットで「優秀なイラストレーター」を召喚した。

その結果出来たのがトップページの画像。

さすが優秀なイラストレーター。3時間でできました。

はぁ〜


6. 謙虚な気づき

結局、AIがアホなのだろうか?

いや、もしかしたら……。

私の「プロンプト(指示の出し方)」が、彼らにとっては「右に行きながら左に曲がれ」と言っているように聞こえているのかもしれない。

「AIが悪い」と切り捨てるのは簡単だが、歩み寄る努力が足りないのは、もしかして私の方……?


結局はプロンプトの出し方が悪いのかもしれない、と謙虚な一面をのぞかせるかんつまであった。

コメント

タイトルとURLをコピーしました