最近、画像の生成AIについて色々調べていて、そろそろOpenAI社のDALL·E(ダリ)3に飽きてきたのもあり、画像生成AI至高のMidjourney(ミッドジャーニー)を試してみようかと考えていたのですが、一つ忘れてました。
灯台下暗しですね💦
愛用のAdobeでFirefly(ファイアフライ)があったのを思い出しました。
ということで、少し検証したいと思います。
まずは、以下の画像をChatGPTに食わせました。
この画像について、30項目で詳細を説明してください
人物: 写真の右側には白いシャツを着て黒いジャケットを羽織った男性が写っています。
表情: 彼はカメラに向かって微笑んでいます。
髪型: 黒い短髪です。
目: 目は笑顔で細くなっています。
背景: 背景には家庭用のキッチンが見えます。
壁の装飾: 背景の左上には、緑の葉の模様が描かれた布が掛かっています。
キッチン用品: 右側にミキサーがあります。
植物: ミキサーの上には緑の植物が置かれています。
電化製品: ミキサーの隣にケトルが見えます。
台所用品: 背景の左側には、包丁やまな板などのキッチンツールが見えます。
テーブル: 中央には木製のカウンターテーブルがあります。
ダルマ: 中央に大きな緑色のダルマが置かれています。
ダルマの目: ダルマの片方の目は塗られていません。
ダルマの顔: ダルマの顔は伝統的なデザインで、怒ったような表情をしています。
ダルマの色: ダルマの本体は緑色で、金色の部分も見えます。
ダルマの文字: ダルマには黒い漢字が書かれています。
照明: 上部にガラス製の吊り下げランプが見えます。
窓: 背景の中央には窓があり、外光が差し込んでいます。
収納: 窓の右側には棚があり、調理器具や食器が置かれています。
キッチンの壁: 白い壁で清潔感があります。
家庭的な雰囲気: 全体的に家庭的で温かい雰囲気です。
ダルマの意図: ダルマはおそらく目標達成のためのものでしょう。
男性の姿勢: 男性はリラックスした姿勢で立っています。
衣服の質感: シャツとジャケットはカジュアルで快適そうです。
キッチンのデザイン: モダンなデザインです。
ダルマの大きさ: ダルマは非常に大きく、男性の胸の高さに達しています。
照明の明るさ: 室内は明るく、自然光と照明がうまく調和しています。
背景の詳細: 左側の布の後ろにはさらに収納スペースがあるようです。
ダルマの材質: 木製または紙製のように見えます。
全体的な印象: 笑顔と大きなダルマが目立ち、ポジティブな雰囲気を感じさせます。
次に、人物の詳細と、だるまの詳細について、色や大きさや形など、細かい部分を説明してください。
人物の詳細
性別: 男性
年齢: おそらく30代から40代
服装:シャツ: 白いポロシャツを着ています。
ジャケット: 黒いカジュアルなジャケットを羽織っています。
パンツ: 見える範囲では、灰色または薄いストライプのズボンを履いています。
髪型: 短めの黒髪で、前髪は軽く流しています。
顔の特徴:目: 細めで笑顔により細くなっています。
口元: 笑顔で、歯が少し見えています。
肌色: 健康的な肌色です。
体格: 標準的な体格で、健康的な印象を受けます。
姿勢: リラックスした姿勢で、右手をダルマの上に置いています。
表情: 明るくフレンドリーな表情です。
ダルマの詳細
色:基本色: 緑色
顔の部分: 顔は白地に黒と赤のデザインが施されています。
金色の部分: ダルマの下部には金色の装飾があります。
形: 伝統的な丸いダルマの形で、底が重く安定しています。
大きさ:高さ: 約60-70センチメートル(男性の胸の高さまであります)
幅: 約50センチメートル(幅広い)
顔の特徴:目: 片方の目は塗られていません。もう片方の目は黒く塗られています。
眉毛: 太い黒い眉毛が描かれています。
口元: 口は赤で描かれ、特徴的な形をしています。
漢字: ダルマの両側に黒い漢字が書かれています。おそらく「必勝」や「成就」のような意味のある言葉です。
装飾: 金色の部分には手や足を象徴する模様があります。
質感: 見た目からは木製か紙製の伝統的な手作りの質感が感じられます。
用途: 目標達成や願掛けのための伝統的なダルマです。
全体的に、このダルマと男性の写真は、ポジティブなエネルギーと決意を象徴しており、家庭的で温かい雰囲気を醸し出しています。
この、出力された長文をプロンプトに、画像生成してもらいました。
すると、Fireflyは文章が長すぎて画像の出力ができませんでした。
しかし、ChatGPT(Dall-e)は、気合で出力してきました。さすがテキストに強いだけの事はあります。
以下出力します。
おぉ~、まぁまぁやるやんか 笑
画像の勝負としては成り立っていないので、仕切り直します。
(さっきの長文を)要約して一つの文章にまとめて
写真には、白いポロシャツと黒いジャケットを着た男性が、家庭的なキッチンで緑色の大きなダルマと一緒に写っています。男性は短い黒髪で笑顔を浮かべており、リラックスした姿勢で立っています。ダルマは高さ約60-70センチメートル、幅約50センチメートルで、緑色を基調に金色の装飾が施され、片目だけが黒く塗られています。ダルマの側面には黒い漢字が書かれており、目標達成や願掛けの象徴となっています。この写真は全体的にポジティブで温かい雰囲気を醸し出しています。
では、これをプロンプトの代わりとして、出力してもらいましょう。
まずはFireflyから
いきなり4つ出してきたところが素晴らしい!
なんかダルマがちょっと違う(全然違う)けど、仕上がりは、かなりクオリティ高いですね!
では、Dall-eを見てみましょう。
まずまずといったところですね。悪くないです。
限りなく写真に近い仕上げにしてください
なんでやねん💦
写真風にはなってないし、なぜかエプロン脱いどるやないか 笑
今回は、元画像をChatGPTに食わせて、画像を分析させたので、当然ながら全体の構図はDall-eが勝ってますが、画質などは圧倒的にFireflyの方がクオリティが高く、まだまだ調整できる機能が備わっているので、トータルしてFireflyに軍配が上がるだろうと言ったところでしょうか。
また、時間が空いた時に色々検証してみたいと思います。