スキップしてメイン コンテンツに移動

画像生成AI「Midjourney V5」登場

指がちゃんと出来てる。

Gigazine に画像生成AI「Midjourney V5」登場、超高画質&AIが苦手な「手」もキレイで実写との区別はほぼ不可能という記事が。

Midjourney が V5 になりました。
今まで正しく描けなかった手と指の辺りも問題なく描けるようで。

「Midjourney V5」では超高画質な画像生成が可能となっているだけでなく、画像生成AIの課題であった「『手』を正確に描写できない問題」が解決されたという報告も寄せられています。
今までの画像生成 AI って人間の顔とか身体とかは、
ほぼ実写?って感じの画像を生成していましたが、手の周りの表現。
特に指の辺りは上手く描く事が出来ず、指が 5 本ではないものを描くことが有りました。

これが何らかのブレークスルーが有ったのか解決したみたいですね。

「Midjourney V5」では「プロンプトに対する反応の向上」「出力画像の解像度が2倍に」「プロンプトに含まれるテキストの量を減らしても詳細な画像を出力可能」「2:1を超える幅広画像に対応」といった機能改善が実施されているとのこと。
解像度 2 倍ですか。それは生成画像を縮小表示とかしたら、実写と区別は多分無理ですね。
しかも、引数の文字情報を減らしても狙った感じの画像が生成されるなんて、
進化の度合いは凄いですねぇ。

記事には Midjourney V5 で生成した画像で、苦手の手の周りのものもありますが、
全然違和感無いんですね。
今まで機械生成の見分けは手を描かしてみて、指の数がおかしいとか不自然で見分けれてましたが、
Midjourney V5 だともう見分けつかない。

上記のように「Midjourney V5」では非常に美麗な画像を生成できますが、弱点も存在しています。例えば、以下の画像は一見すると実写風に見えますが、よく観察すると「画像左側の陳列物がガラスケースを貫通している」「看板に判読不能な謎言語が記されている」といった非現実的な部分もあることが分かります。
言われて画像見ましたが、まぁ、確かにそうだけど、違和感感じない感じないレベルで破綻しているだけなので、
テスト段階でこのクオリティだとしたら、
小さい問題の部分を煮詰めて正式版として Midjourney V5 が出た時には、
画像生成している。というのは分からないレベルなんでしょうねぇ。

画像生成 AI 、GPT と AI 周りの進化がもの凄い速度で進んでますね。
これ、本当に 2025 年にはシンギュラリティが起こるかもですねぇ。

コメント