【AI画像生成】MacでStable Diffusionの利用できるアプリ「Diffusion Bee」を試してみる(Greg Rutkowskiって何?)

AIの画像生成が直近のパラダイムシフト🤯の鍵を握っている予感がしますね。

今もっとも有名なのは、

なのですが、後発のStable Diffusionに興味シンシン🤩

Midjourneyを超えた? 無料の作画AI「 #StableDiffusion 」が「AIを民主化した」と断言できる理由

上記Business Insider記事にもあるが、Stable Diffusionのほうがより写真に近く、Midjourneyは(おそらく意図的に)絵画的な演出が加えられた表現になるようだ。

また、注目すべきは以下。

  • オープンソースで無償公開されており、商用利用も可能
  • 従来の同等品に比べて、画像生成が高速かつ軽量
  • 一般家庭にあるゲーミングPCで動作可能なほどコンパクト
  • 20億枚の画像と言葉のペアを学習している
  • NSFW(Not Safe For Work=職場で開くのに相応しくない画像)を自動判定

なんと有能なAIが無償で提供され、これは世の中の天地がひっくり返る事が起きたなと。😂

想像はしていたけど生きているうちにこんな世界が来るとは思っておりませんでした(グーグルマップを初めてみた時も鼻血出そうになったけど)

世界変革の前夜は思ったより静か

THE GUILDの深津貴之氏のNoteの記事からも今後の世の中の変化予想がよく読み取れる。当然だが法的な問題もかなり追いついていない🤣

さぁーそれはさておき、とにかくStable Diffusionを手軽にMac環境で使いたい。

Macでもデスクトップ上で簡単にAI画像生成「Diffusion Bee」

本来はPythonで実行するのですが、もっとお手軽に〜🤔って調べていたら、

好みの画像を生成できるAI「Stable Diffusion」をmacOS環境で超簡単に実行できる「Diffusion Bee」が登場したので使ってみた

出ていました、UI付きのStable Diffusion実行環境「Diffusion Bee」。

残念ながらM1以降のMacでないと動かないみたいです。それだけ複雑な処理をしているという事なのか🙄

早速インストール

インストールしてみましょう。

インストールも通常のアプリケーションとなんら変わりはありません。Applicationフォルダにドラッグするだけです。

インターフェースもとってもシンプル。「Text To Image」の部分に生成したい画像の説明文を入力するだけ(英語で)。

試しにやってみる

とにかくなんの知識もなく、やってみたのがこれ。入力したワードは以下です。

Sazaesan, Sunday, Last night, Japanese family, Living room, animation, dinner time with TV, don’t want to go school tommorrow

まったくもってどんな結果がでるかわからないけど、なんとなく日曜の夜だったんでサザエさんっぽいの出てこないかなって期待しながらしてみました😅

で、出力結果・・・

🤣🤣🤣🤣🤣🤣

まったく「サザエさん」でない画像が生成されました!

まずは服装、「Japanese」という部分がそうとうこの画像に影響を与えているのだろうか、この服装は日本風なのかと😂
そして「dinner time with TV」という事なので晩飯時の絵のようなのですが「蛍光緑のスープ」😂😂 抹茶のイメージなのかな?
背景に床の間のようなところと「盆栽」のような植木がある😂😂😂
お顔が崩壊していますが、「don’t want to go school tommorrow」という部分になるでしょうか😂😂😂😂

うーん、これは日本人からしたらまったく日本を表現した絵ぢゃあない🤣

友達とメッセージをやりとりしながら遊んでいたのですが、お次はO氏が生成した画像。

future robots like a JoJo’s Bizarre Adventure

ジョジョ風をイメージしたという。。。

構図とかポーズ、背景がそれを醸し出していますな😄
特に奥のキャラはスタンドっぽいわ。

呪文(Prompt)と呼ばれているらしい(AIへの指示の仕方)

ただここで疑問点というか、ツィッターなんかで紹介されている生成画像はもっとちゃんとしている。。。なんか英語だし、指示の仕方がわるいのかなぁと思ってしらべてみました。

いろいろ調べた結果、ようするに書き方(AIへの指示の仕方)が悪いようだった。AIが理解できるような書き方で書くだけで処理結果がだいぶ変わるらしい。このAIが理解できる文字列を「呪文(Prompt)」というらしい。ふぅーん、なるほど🤔 んで、実際に生成された画像から「呪文(Prompt)」をチェックできるサービス「Lexica」というのがこちら。

Lexica

上のLexicaを見ると、highly detailedとかdramatic atmosphereとか、普段利用しなそうな単語が色々含まれていることがわかった。

なんだか高い確率で入力されているGreg Rutkowskiという呪文

一つ気になったのが、「Greg Rutkowski(グレッグ・ルトコフスキ)」という人名がよく入力されている。調べてみると、どうやら有名な方で、ポーランド出身のデジタル・アーティストでした。

Greg Rutkowski

おっと、さっそく問題になっていたんですね😰

ステーブル・ディフュージョンに入力された指示文と出力結果を1000万件以上追跡しているWebサイト「レクシカ(Lexica)」によると、ルトコフスキの名前は指示文の中で約9万3000回使用されてきたという。ミケランジェロ、パブロ・ピカソ、レオナルド・ダ・ビンチなどの世界で最も高名な芸術家たちの名前は、それぞれ使用回数が約2000回以下だった。ルトコフスキの名前は、指示文から画像を生成する別のAIシステムである「ミッドジャーニー(Midjourney)」のディスコード(Discord)でも、数千回使用されている。

「AIに埋め尽くされる」画像生成AIブームの影で苦悩するアーティスト

何もわからず入れてしまうのも問題のようですね😱

改めてAIが理解できそうな呪文を考える

Lexicaを見て、いろいろ分かってきたので、改めて上手く描いてくれそうな呪文を入れてみようと思います。利用した呪文は以下。海でパンダがピザ食べてビールを飲んでいる、という予定。

Portrait of a cute panda is eating pizza and drinking beer in the blue ocean, character art, highly detailed, sharp focus, anime, 8k realistic shaded, masterpiece

で、下が出力結果。

おぉぉぉ!今までで一番マトモな絵だ(もちろん紆余曲折あった結果です)👍

なんかピザにガッついているパンダってコワっ😂

まとめ

いかがでしたでしょうか?

プロンプトエンジニアなんて職業も出てきたみたいです。
これ、ブログのアイキャッチ用に毎回生成するのも悪くないですねー!👌

追記

ちょっと趣向を変えて作ってみました。

Many zombie in Akihabara, dark atmosphere, another planet, highly detailed, sharp focus, 3d realistic model render, 8k realistic shaded, cinematic masterpiece

AIは未来っぽいものとか、ゾンビとかが得意みたいです🤣

Yuki Nakata

中田デザイン事務所 代表

WEBデザイナー / WEB講師 / 海外販売 他

お仕事のご相談はお問い合わせフォームへお願いします。
事務所概要はコチラ