モデルによる違い: InvokeAI

InvokeAI の標準モデルである、「 stable-diffusion-1.5 」標準でインストールされているアニメスタイルモデル「 waifu-diffusion-1.3 」そして、アニメスタイルに特化した「 Hentai Diffusion 」この 3 つで同じキーワードによる画像生成をしてみました。衝撃的な結果になったので、画像見てください。

一番左が「 Hentai Diffusion 」、真ん中が「 waifu-diffusion-1.3 」、そして衝撃映像の「 stable-diffusion-1.5 」。なんでこんな感じになってしまったんだろうw 「 stable-diffusion-1.5 」を弁護するわけではありませんが、リアル画像を中心にモデリングされているので、苦手なんでしょうね。風景関係は「 stable-diffusion-1.5 」が一番上手です。

9 つのモデルで試してみる

現在私の環境で動かすことができる 9 つのモデルを使って同一のキーワードでやってみます。できるだけ衝撃的な画像が出ないようにしつつ…  Seed( 種 ) はランダムにセットされるようにしてあるので、キーワードを同じにしても同じ画像が出てくるとは限りません ( というか、出てこないでしょう ) 。

green moss, cute girl with black hair, white jacket, fine details, best quality, {{{masterpiece}}},

結果はこれですね。

バージョンが古い Stable Diffusion-1.4 はちょっと残念な画像になりましたが、それ以外は特徴がありますね。 papercut-1.0 と voxel_art-1.0 はこういう画像に特化したモデルですので、これでいいです。 papercut-1.0 は味があって好きです。

著作権について

世の中にはいろんなモデルがあって、楽しいですねぇ。ただ、著作権的にグレーだったりするものもあるんだそうです。生成された画像の著作権についてはそもそもはっきりしていないので、これからも議論があることと思います。

このデータセットに含まれる画像の著作権についての議論が、 AI 技術の進歩に追い付いていないのが現状です。

画像生成 AI の著作権問題について海外や日本ではどのように解釈されているのか? - GIGAZINE

モデルの生成過程において、著作権的にブラックだったりグレーだったりするものもあるんだそうです。勉強不足でその辺の理解追いついていません。私の場合、生成された画像の使い道としては、このブログに関する部分に限定するつもりです。

マイブームになっている、 InvokeAI ですが、わからないこともたくさんあります。そして生成した画像を展開する場所も欲しいなぁと思っています。どうしようかなぁ。

投稿者プロフィール

kaizawa
kaizawaブロガー
新潟県在住。1964年生まれ、東京オリンピックの年ですね。
突然燃え上がったり、鎮火したり興味の波が激しいので注意が必要です。
最新の投稿

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

CAPTCHA


Tech

前の記事

今日も InvokeAI で遊ぶ