Stable Diffusionのimg2imgで画像生成してみました。
元画像は前回作成したものを流用。
生成モデルやプロンプト(呪文)は前回と全く同じにしましたが、Sampling method、Sampling stepsは変えてます。
また、画像サイズが正方形なのはちょっと使いづらそうなので横を長くして2:3の512:768サイズにしてます。
本当はもっと大きなサイズにしたかったのですが512をベースにしないと、ぱっと見でおかしいと分かるような破綻した画像ばかりになってしまうので諦めました。
設定画面
作成した時の画面はこちら。
バッチ処理で200枚(2並列×100回)出したので生成後の画像が大量に並んでます。
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_10-1022x1024.jpg)
200枚のうち、うまくいった例とうまくいかなかった例を4枚ずつご紹介します。
うまくいった例
比較的うまくいった例です。
商用利用するには微修正が必要かと思いますが、挿絵的にちょっと使うくらいなら全然大丈夫なクオリティですね。
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_21.jpg)
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_22.jpg)
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_23.jpg)
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_24.jpg)
うまくいかなかった例
ぱっと見はうまくいっているように見えるのですが、明らかにおかしい場所があります。
帽子が浮いてる??
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_31.jpg)
手が変。特に親指の描写が苦手のようです。
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_32.jpg)
これも手がおかしいです。描写されているのは右手ですが右腕の向きと繋がってないです。
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_33.jpg)
向かって左の水着が浮いてます。影の描写がおかしいですね。
![](https://kengoyamamoto.com/wdp/wp-content/uploads/2024/02/image_generation_ai_2_34.jpg)
感想
img2imgを使うことで同じような画像を生成することができるので、特定の画像と同じようなレイアウトの画像を生成したいときには役立ちそうです。
コメント