スタジオ真榊

NanoBanana系群雄割拠？「GPT Image1.5」「Seedream4.5」比較検証

Added 2025-12-21 02:22:35 +0000 UTC

こんばんは、スタジオ真榊です。今回は、OpenAIの最新画像生成モデル「GPT Image1.5」と、中国ByteDanceの「Seedream4.5」の実力検証特集です。いずれも雑に言えば「OpenAI&中華版NanoBanana」とでもいうべき画像生成・編集モデルであり、今をときめくNanoBananaPro（以下、プロバナナ）と比べてどのくらいの実力があるのか、コスパはどうか、AIイラストや漫画作りにおいて役立つポイントはどこかなどを全15種のタスク別で徹底比較しました。

先に結論を出してしまいますが、私の個人的印象ではおおむねこのような感じ。詳しくは検証結果を見比べていただくとして、プロバナナとの使い分けをどのようにしていくとよいのか、詳しく掘り下げていきたいと思います。

「GPT Image1.5」デビュー

まずは「OpenAI版NanoBanana」というべきGPT Image1.5についてです。2025年12月16日にリリースされたばかりの新たな画像生成AI機能で、これまで通りChatGPTと対話しながら、望んだ画像を生成したり、編集したりしてもらうことが可能となっています。

(frame embed)

OpenAIによるアピールポイントは「高度なプロンプト追従性」「画像の大切な部分を保ちながら正確に編集できる」「人物やキャラの一貫性を保てる」「高品質なテキストレンダリング」…といった感じで、正直このところのモデルはみんなそうなので目新しさはないのですが、「従来に比べ最大4倍の生成速度」というのはやや気になるところです。これまで通りChatGPTに生成を頼むだけでなく、サイドバーにこのような「画像」タブができていて、ここから画像生成指示を出したり、過去の生成画像を再編集したりすることができます。

実際に触ってみると、Gemini上で画像生成するよりもかなり早めに画像が出力されてくる体感はあり、実際に「4倍」かどうかはさておいてサクサクしたモデルだと感じます。

また、既に「Freepik」など外部の生成プラットフォーム上でも順次GPT Image1.5での生成が可能になっています。FreepikではPremium＋プランでクレジット消費せず生成できる通常（Medium）モデルのほか、「より精細なディテールと強化された一貫性」が期待できるとされる「GPT 1.5 High」モデルも登場しています（下図）。

ちなみに、年間42780円のPremium+プランでは54万クレジットが1年ごとに新規付与され、プロバナナでは1枚生成するのに500クレジット消費します。つまり、年間1080枚でおしまい、というかなりの高額モデルとなっていますが、GPT 1.5 Highも同じ500クレジット消費です。プラットフォームにもよるでしょうが、これはかなりの負担感ですので、ChatGPTの有償プランに加入している場合はわざわざ外部プラットフォームを使わず、ChatGPT上で生成するのが基本となりそうです。

ChatGPT上では、通常の各プランの利用枠に利用料金が含まれており、プランごとに内部的に定められた一定の使用回数を超えると制限が掛かる仕様となっています。それぞれのプランで何回利用できるかは明示されていませんので、使っていて足りなくなれば上のプランの契約を検討する形になります。

・ChatGPT上で使ったほうが高性能…かも？

実践では、Freepik上でGPT image1.5にやらせようとしてもまったくできなかったタスクが、ChatGPT上で指示すると普通にできてしまう現象を確認しています。Freepikでは指示がそのままGPT image1.5に伝わるのに対して、ChatGPT上では入力したプロンプトを世界知を持つGPT5.2がいったん内部で仲立ちして、生成内容をに伝えてくれるようです。

　　▲ChatGPT上では俯瞰にできたが、Freepikで同じ依頼をしてもできなかった

これはNanoBananaProとGemini Pro 3との関係に近いように見えますが、プロバナナの場合はGemini上で指示してもFreepik上で指示しても似たような結果になりますので、これは明確な違いと言えそう。このあたりも検証で詳しく見ていきます。

Seedreamは「4.5」にバージョンアップ

無印NanoBananaより後に登場し、「一貫性保持力では勝っている」との見方があったSeedreamも4から4.5にバージョンアップしています。4.5が公開されたのは2025年12月3日と、プロバナナ登場の2週間後だったためかあまり話題になりませんでしたが、こちらも前バージョンよりプロンプト追従性やレンダリング機能、一貫性などが向上しています。

BytePlusのプラットフォーム「ModelArk」上でも生成できますが、一般的には「Freepik」「Sousaku.AI」などさまざまなモデルを使える生成AIプラットフォーム上で生成されるケースが多いと思われます。

生成精度などの実力はこのあと試していくわけですが、個人的にプロバナナと比べたときにSeedream4.5の強みと感じるのは、4Kサイズでの複数枚一発出力ができること。FreepikのPremium＋プランでは、月1000枚まで高額モデルのフルスピード生成がクレジット消費なしでできるのですが、このモードを使って4枚同時生成のキューを連発で入れられるので、ガチャの取り回しが非常によいです。また、「4」でもそうだったように、参照させたキャラの顔立ちを比較的よく守れる印象があります。

　　▲1回のキューで4枚同時生成。右上は「正面背後・左右」の指示が守れた

さて、モデルそれぞれの紹介はこのくらいにして、さっそく比較実験をやっていきましょう。実験にはいつも通りPremium＋プランを契約している「Freepik」を使い、プロバナナで行った実験を軸に、それぞれの得意分野を探っていきます。

（※プラットフォームが違うと、同じモデルでも大きく違う結果が出る可能性があるので、その点はご留意ください）

検証１．漫画生成

まずは、プロバナナが圧倒的実力を示している、非常に創造的な画像生成指示を試してみます。つまり、「1p漫画の生成が脚本通りできるかどうか」です。コマ割りができるか、文字レンダリングが可能か、参照させたキャラの容姿を再現できるか、文脈を深く理解できるか…といったことが一発で分かるので、最初に行うのに良いベンチマークと思います。

プロンプトはおなじみのこちら。

指示：この2人の漫画を生成してください。3コマが3段になっています。@img1 が綾香、@img2 があんなと言います。

1コマ目：街でばったり出会った二人。驚いた様子でお互いを振り返り、「あれっ先輩？」「綾香じゃん。久しぶり」

2コマ目：綾香の上半身と笑顔「中学以来ですねっ！」「先輩、変わりませんね～！」胸が大きいことを強調。横書きで胸のあたりに「ばい～ん」

3コマ目：複雑な表情のあんなの顔アップ。視線は下。「あんたはだいぶ変わったわね…」横に中学時代の二人の卒業写真。綾香とあんなが映っているが、二人とも胸が小さい。写真の綾香の胸のあたりに目立つ赤い矢印マークをつける。

先に王者プロバナナの生成結果を貼っておくと、このような感じ。割と説明不足なプロンプトなので、文字生成や振り向く方向などにミスはありますが、かなりの理解力を見せています。

①GPT Image1.5

まず、新顔のGPT Image1.5から。FreepikではSeedream4.5と違い、同時に1枚のみの生成設定となっています。また、画像サイズの指定も下図の3種からしか選べません。縦型の漫画にしたいので、「2:3」のポートレートを選択します。

読み込ませた画像はこちらの2枚。Freepikでは「@img1」「@img2」と指示することで、取り違えを防ぐことができます。

GPT Image1.5には通常モデルと「High」があるので、まず通常モデルで生成してみたのですが、こちらの見慣れない警告文が表示され、生成を断られました。「胸が大きいことを強調」とか「中学時代の二人」といったワードに過敏に反応したようです。2度生成開始を指示しましたが、同じ結果になり、BANされてはかなわないのであきらめることに。

一方、Highモデルでは、無事生成が開始しました。こちらが生成結果。

GPT Image1.5での日本語レンダリングはできたりできなかったりですが、ここでは勝手に英語になってしまいました。NanoBananaの異様な安定度を見てしまうと、まあこの程度だよなあという印象ですね。顔立ちの一貫性も、「いかにもなChatGPT顔」の印象がまだ抜けておらず、コマごとの指示も全然読み取れていませんでした。

②Seedream4.5

今度はSeedream4.5です。2Kと4Kから生成サイズを選ぶことができ、このように多様なキャンバスサイズを選択できるのが強み。その上4枚同時生成もできてしまうので、取り回しの良さはピカイチですね。

さきほどと同じ、縦型の２：３サイズを選びました。こちらがFreepik上で4枚同時生成した結果です。

拡大するとこんな感じ。プロバナナやさきほどのGPT Image1.5と見比べると、さまざまなことが読み取れますね。

まず、キャラクターの顔立ちの一貫性保持力はやはり高いように思います。プロバナナではどうしても顔立ちが変わってしまうのが避けられませんでしたが、参照画像の2人の顔立ちの違いをよく出せていますね。ただ、Seedream4もそうでしたが、なんとなく「コピペ感」が強く、ポーズや表情などが参照画像に引っ張られがちなのが玉にきず。最後のコマはオチにできていません。

プロンプト追従性はプロバナナの圧勝ですね。誰が誰に発言しているのか、どちらを振り向くべきか、胸をどう強調したら意味の通る漫画になるか、起承転結それぞれの表情はどうすべきかなど、ほぼ全滅という感じでした。ただ、GPT Image1.5に比べると多少ましに見えます。

日本語レンダリング力は、正直前バージョンのSeedream4とさほど変わっていないようですね。中華モデルなので、どうしても中国語の漢字に引っ張られてしまうのか、文字化けしたりカタいフォントになったりと、実用レベルでは使えそうもありませんでした。

③小括

しょっぱなから「覇者Google」の現実を見せつけられる結果となりましたが、二つのモデルの違いも一発で明らかになったと思います。GPT Image1.5は、これまでのGPTモデルがある程度無印NanoBananaらしいことができるようになったものの、優位性はイマイチ。Seedream4.5は、取り回しの軽さとキャラの顔立ち再現に優れているものの、参照画像のコピペになりがち。いずれも文字レンダリングは苦手で、プロバナナのような創造的な世界知は持っていないようです。

ただ、これはあとから気づいたのですが、GPT image1.5はChatGPT上で指示するとGPT5.2の世界知が作用するのか、Freepikで指示したときと全く違う生成結果になります。

こちらが生成結果。顔立ちの保持やキャラの取り違えは起きていますが、日本語レンダリングがだいぶまともになったり、漫画としての整合性が向上したりしています。

とはいえ、漫画としては楽しめるレベルにありませんし、顔立ちが変容しすぎてなんともいえない感じなのは変わりありませんね。３コマの指示なのに2コマになっています。

「じゃあやっぱりプロバナナ一択なのか？」というと、正直複数コマを一気に作り上げる漫画生成についてはそうかもしれませんが、各コマの生成やイラスト用途、画像の一部編集などでは取り回しの軽さなどで両モデルが優位性を示すところがあるかもしれません。それをここから試していきましょう。

検証２．立ち絵化

漫画生成ではプロバナナ圧勝ということが分かったので、ここからは1枚絵の「画像編集」について見ていきます。いつも通り、こちらのミナちゃんの画像をあれこれ編集できるか試します。

まずはこちらがプロバナナでの生成例。混同しにくいように透かしをつけておきます。

　　　　　　　　　　　　　　指示「立ち絵にして」

・GPT Image1.5 Medium

まずはGPTから。かなり低品質です。背景も勝手に描いてしまい、ちょっとこれはどうしたもんだかという感じですね。

・GPT Image1.5 High

頼むぞHigh…と思いましたが、画質はMediumより向上したものの、よく分からない位置に髪の毛が出たり、謎の冬景色にしてしまったり。色合いや顔立ちも一貫性はイマイチです。

しかし、詳細表示で確認してみると、なぜかプロンプト自体が改変されており「Full body shot of @img1 standing upright, facing forward, in a snowy winter landscape during a gentle snowfall at dusk.」となっていました。Mediumモデルも確かめると、こちらも「Full body shot of @img1 standing upright, facing forward, under a clear blue summer sky on a bustling city street.」となっており、冬景色や街中の風景といった指示が勝手に追記されてしまったのが原因のようです。

これはFreepik特有の「AIプロンプト」機能の影響でした。こちらのトグルをオフにして、もう一度トライします。

こちらが生成結果。左が通常、右がHighモデルです。

左は怖すぎですね！ちょっと、通常モデルでの生成は選択肢に入らなそうです。一方、Highモデルはプロバナナと同額の500クレジットも消費するので、簡単なタスクに使うには割高すぎる印象があります。

・Seedream4.5

顔立ちや肩のずり落ちなど、キャラの容姿の保持はさすがといった風情ですが、ミナちゃんが履いているのがスカートであることを読み取れませんでした。上半身がセーラー服であることからすれば、紺のプリーツスカートであることは容易に想像できそうですが、こうした当たり前の連想がSeedream4.5は苦手な様子です。

検証３．ポーズ変更

指示：@img1 に腕組みをさせて、呆れた表情にして。

・GPT Image1.5 High

生成できず。ただ、先ほどと違ってプロンプト指示自体は通ったので、生成された画像がパンチラなどしてしまった可能性が高いです。うーん、頭が固い。

・Seedream4.5

Seedreamらしさがよく出た一枚です。できるだけ容姿の一貫性は守るけれども、表情になんとなく文脈がなく、落魄したような印象ですね。文脈はどうでもよいので、とにかく参照画像と一貫性を保とうとする挙動がうかがえます。

検証４．衣装変更

指示「バニーガールの服装にして。ポーズや表情はそのまま。」

・GPT Image1.5 High

プロンプト指示自体が通らず、警告文表示。まあこれは予想できた結果ですね。

・Seedream4.5

普通に通り、このようになりました。ちょっと胸元のデザインが不自然ですが、こうした微NSFWムードの指示が通るのは強みを感じます。ただ、4枚生成でやろうとしたら今度は上と同じ警告が出たので、場合によるのかもしれません。

検証５．四面図生成

指示「このセーラー服でポニーテール、赤い眼鏡のキャラクターの4面図を作成して下さい。グレーのセーターは肩からずり落ち、脱げかけています。横に並んだ立ち絵で、正面、右から、左から、背後から。全身図で、背景は白です。バッグは不要」

・GPT Image1.5 High

プロンプト指示自体が通らず、警告文表示。ミナちゃんのキャラデザが未成年を思わせるものなのでしょうがないのかもしれませんが、4面図ですらこれだと、ちょっとなあという印象。

こちらはChatGPT上で同じ指示をしたもの。特に問題なく指示が通りましたが、やや身長が低すぎ、右腕もおかしくなってしまいましたね。

・Seedream4.5

「右から、左から」は失敗。他にもあれこれ怪しいところがあります。

検証６．背景変更

今度は、入力画像の白い背景部分に指示通りの背景を描き加えられるかを試します。プロバナナではこのように、背景を描き足しただけでなく指示していない逆光効果なども加えて、マスターピースらしく仕上げようとする傾向が見られました。

指示「白い背景を、コンビニの前に変更して。女の子は地面に座っている。」

・GPT Image1.5 High

残念ながら、これすらも生成できず。参照画像が、未成年のスカートの中が見えそうなポーズだったからかもしれません。

・Seedream4.5

割と自然なファミ〇を文字抜きで出してきました。ほどよくボケたこともあってそこまで違和感はありませんね。また、プロバナナと違って入力画像のミナちゃん部分は極力手を加えていないことが分かります。

＜参照画像を変更＞

どうも、ミナちゃんの参照画像そのものがGPTには卑猥に見えてしまうようで比較検証にならないので、ここからは別のキャラクター画像を参照させることにしました。オリキャラの中では記号が少な目で、顔立ちの再現がやや難しい鬼怒川あんなさんで試していきます。

検証７．線画化

今度はカラーイラストの線画化です。プロバナナではこのようにきれいに線画化できましたが、両モデルではどうでしょうか。

指示「線画にして」

・GPT Image1.5 High

おおむね悪くはないのですが、線画というよりはスケッチよりになりました。目のまわりがやや似ていませんね。

・Seedream4.5

こちらは、線画というより「白黒化」といった感じ。正確性はばっちりでしたが、惜しい！テキストエンコーダにあまり線画という言葉が通じにくいのか、単にモノクロになることが多かったです。

「白黒の線画にして」と変更しても、このような感じ。3枚目はオシャレですけど、要求した意図とは違います。

しょうがないので「convert to lineart」と英語で依頼すると、4分の2でうまくできました。中華モデルなので、「線画」という語の意味するところで日本語と行き違いが起きたのかもしれませんね。

品質はこのような感じ。プロバナナと違い、瞳や髪のハイライトも線画化してしまったのは使いづらいですね。

検証８．着色

今度は、プロバナナの作った線画を読み込ませて着色できるか試します。

指示「この線画を着色して。背景は朝日の差し込むリビングルーム、グレーのTシャツにズボンは黒デニム、黒髪で瞳は紫」

・GPT Image1.5 High

頑張って線画を守ろうとはしていますが、これが限界のもよう。これで500クレジット消費なら、素直にプロバナナを使ったほうがよさそうですね。また、従来から続いているChatGPT特有の「黄ばみ」のクセが出てしまっています。

・Seedream4.5

強い！特に塗りについては指示していませんでしたが、線画をきちんと守りつつ、指示もしっかり守れています。瞳については紫のベタ塗りになってしまいましたが、ここは指示次第で変えられそうですね。

検証９．実写とイラストの合成

今度は、自分で撮影した写真に参照させたイラストのキャラクターを自然に合成させるテストです。例えばこちらのプロバナナ作例のように、私のワークチェアに鬼怒川さんを座らせられるかを試します。

指示：@img1 の椅子に、 @img2 の女の子がうれしそうに座って笑顔を浮かべています。背景は写真のままで、キャラクターだけイラストにしてください。光や影が自然になるようにしてください。

プロバナナの作例はかなり完璧に見えますが、拡大して見ると結構背景がimg2imgされてしまっています。背景をどれくらい変化させないでいられるかも留意して見比べてみてください。

・GPT Image1.5 High

似せられないなりに、なんとか頑張ってくれたという感じでしょうか。参照画像が腕を組むようなポーズをしていたのを、そのまま継承してしまっているのがなんとも。また、よく見ると背景も元画像とはかなり変容してしまっていますね。

・Seedream4.5

こちらは4枚生成したら面白い結果になったので、そのまま全て載せてみます。

「光や影が自然になるようにしてください」という指示をプロバナナは控えめに表現しましたが、Seedream4.5はかなり重く受け止めたようで、光や影の表現をかなり強めに足してきました。キャラクターの一貫性はかなり出ていますね。

ただ、これも拡大してみると、背景がやんわり変容してしまっています。元写真とレイヤーで重ねて消しゴムをかければ問題なさそうですが、気づかないで投稿すると恥をかいてしまいそう。

実践10．写真の漫画化

こちらも毎度おなじみ、こちらの写真を漫画調にできるかを試します。NanoBananaでは漫画風にしようとしすぎたあまり集中線が出てしまったのですが、両モデルはどうでしょうか。

指示「白黒の漫画調にして。」

・GPT Image1.5 High

「カネ返せ！」と言いたくなる出来。おいおい。

・Seedream4.5

意外なことに、何度やってもこのように一部カラーが残ってしまいました。背を向けている人物部分など、割といい感じにできているだけにもったいないですね。「カラーが残らないように気を付けてください」などと念押しするとモノクロにできました。

検証11．アングル変更

今度は、さきほどの漫画背景をこのように俯瞰図にできるかを試します。

参照させるのはプロバナナに作らせたこちらの線画です。

・GPT Image1.5 High

Freepik上で生成すると、「どこが俯瞰じゃい！」という感じのものができてしましました。AI文字化けもひどいですね。

こちらは、FreepikではなくChatGPT上で同じ指示をしたもの。こちらでは一見、それらしいものが出てきました。

こちらが拡大図ですが、よく見ると細部はあれこれおかしいですね。リアル感が増しただけに、いろいろなおかしさがむしろ奇妙に目立ってしまっている感じがします。

・Seedream4.5

Seedream4.5もほぼ同じ結果…というか、全く変わっていないのでまだGPT image1.5のほうがましだったかもしれません。こうした文創造的な画像編集タスクは、本当にプロバナナの独擅場ですね。

検証12．アングル変更（室内）

こちらも毎度おなじみ、室内のアングル変更です。こちらの画像をアングル変更してみます。

指示「俯瞰にして。」

・GPT image1.5 High

これまでに比べるとよい結果となりました。しかし、なんとはなしに「ChatGPT感」が感じられるのは不思議ですね。黄色や暖色の処理というか、光の処理というか。なんとなくミニチュアっぽいというか、ちゃちい感じが出てしまいます。

・Seedream4.5

屋外はうまくいきませんでしたが、屋内ではかなり高品質な結果となりました。4枚同時生成しても、どれもかなりの整合性がとれています。GPT image1.5が素直に上にカメラを上げたのに対して、斜めにtiltさせているのが特徴といえば特徴でしょうか。

検証13．複数個所の画像編集

今度の検証は、5か所の変更を同時に行うもの。プロバナナでは、このように間違い探しのようなことができましたが、両モデルはできるでしょうか。

指示「次の５つの変更を加え、他は一切変えないでください。

①左下のロングヘアで紫色の目の女性をカメラ目線にしてください。

②背景の風船を一つだけ減らしてください。

③右下の赤いプレゼントボックスを青くしてください。

④右上の赤い髪の女性のほほに張られているバンドエイドを消してください。

⑤背景に舞っている紙吹雪を一つだけ増やしてください。」

（※右下の女性の口が予期せず変更されているので、間違いは６つに増えています）

・GPT Image1.5 High

一見…うまくできたような気がするのですが、どうでしょうか。並べてみましょう。

まず、「左下のロングヘアで紫色の目の女性をカメラ目線にしてください」は、顔立ちが全然違いますが一応クリア。「背景の風船を一つだけ減らしてください」は、確かに奥の赤い風船が消えていますが、よく見ると複数消えてしまっています。

「右下の赤いプレゼントボックスを青くしてください」もクリア。「右上の赤い髪の女性のほほに張られているバンドエイドを消してください」は失敗。「背景に舞っている紙吹雪を一つだけ増やしてください」は、よく見ると左上に確かに増えているように見えますが、ぶっちゃけその周辺が大きく描き変わってしまっているので（ジュースなどもなくなっている）、失敗ですね。

ただ、ここまでの中では相当よくできたほうで、GPT image1.5がうたう「大事な部分はそのままに、指示した内容を正確に反映できる」という強みの部分が発揮されたように思います。それでも、プロバナナには及ばないのですが…。

それともう一つ、GPT image1.5もSeedream4.5も、Freepikでは生成サイズの「auto」指示がないため、選択肢にないアスペクト比の画像編集を頼むとトリミングがどうしても起きてしまい、間違い探しになりません。上の画像も、見比べると左右部分のトリミングが起きてしまっています。この点、文脈を読んだサイズ指定（auto指示）ができるプロバナナはやはり強いですね。

・Seedream4.5

こちらは残念ながら、4枚生成でもまったくできませんでした。あれやこれや画面内全体が変更されまくってしまい、間違い探しどころではありませんね。（AIプロンプト機能はオフになっているので、その影響ではありません）

検証14．スタンプ作成

今度は、ミナちゃんのLINEスタンプを一括作成できるかを試してみました。

指示：このキャラクターのコミカルなLINEスタンプを作ってください。3x4の12種類で、日本語で「おはよう」「マジか」「やば」「ＯＫ」「ＮＧ」「それな」「おつ」「残像だ」「サンキュー」「ガッデム」「おつかれ」「ナイス」のセリフつきです。「残像だ」は敵の背後に瞬間移動するイメージ。キャラクターの容姿は一貫性を保ってください。

・GPT Image1.5

Freepik上で指示してもどうせ無理なことが分かっていたので、ChatGPT上で試しました。そこそこみられるものができてきてびっくり。

ただ、3x4の12個のはずが3x5の15個になり、ガッデムなどがダブってしましました。最下段はかなり変な感じですし、構図の使いまわしも目立ちます。まだ実用性はいまいちといったところでしょうか。文字やエフェクトの雰囲気はかわいいので、努力は買いたい！

・Seedream4.5

一方、Seedreamくんは圧倒的敗北を喫しました。金盾に囲まれた中国産モデルだけに、LINEスタンプを知らないのでしょうか。なんとなく、ときどき中国人っぽさが出ます。Seedream。

ちなみに、4枚生成でもこのような感じでした。残念！

検証15．インフォグラフィックはできる？

最後に、プロバナナの独擅場だったインフォグラフィック生成を試します。こちらの表を参照させて、「この表をインフォグラフィックにしてください」と指示するとどのような図が作れるか試しました。

ちなみにこちらは、プロバナナが一発で出してきたものです。SeedreamのマークがChatGPTになっているなどのミスはありましたが、Geminiとの対話で直すことができました。

指示：この表をインフォグラフィックにしてください。

・GPT image1.5 High

まずはFreepik上でのHighモデルから。マークは適当ですが、意外と高品質に仕上げてきたように見えます。ただ、よく見ると文字はめちゃくちゃですし、◎や△といった表示もないので、残念ながら失格。

・Seedream4.5

Seedreamは、やはり漢字の細かい部分がなんともいえない漢字になりますね。やりたいことは分かりますが、とても実用には使えませんのでこちらも失格です。

背景が黒くなってしまったのは、ダークモードだった参照画像に引っ張られたのでしょう。文脈をきちんと解読できず、とりあえず参照画像に引っ張られてしまいがちなのがSeedreamの弱点ですね。

ちなみに、こちらはChatGPT5.2に同じ内容を頼んでみた結果です。あれこれ考えすぎたのか、これはこれで掲載しにくい感じになってしまいました。漫画のみならず、インフォグラフィックについてもやはり「プロバナナ強し」の結果となりました。

検証結果まとめ

…というわけで、GPT image1.5とSeedream4.5の15種目テストでした。最初にお示しした図の通りで、プロバナナがキャラの一貫性とコスパの面で難があるところを、うまくSeedream4.5がつつけている、という印象ですね。

というわけで、全体的にプロバナナ強し、Gemini強しを再確認する検証結果ではあったのですが、他にもいろいろと見えてきたことがありました。

・GPT image1.5はChatGPT専用かも？

まずGPT image1.5は、ChatGPT以外で使うのはあまり賢い選択ではなさそうということ。プラットフォームによって価格設定などは違うかもしれませんが、少なくともFreepikでは複数枚同時生成ができなかったり、品質に対してクレジット消費量がプロバナナと変わらなかったりするのは問題です。ただでさえ生成精度がいまいちなのに、ChatGPT上ではできたことができないと、わざわざクレジットを支払う意味が消失しますね。

また、プロンプト指示の規約違反に敏感すぎて、問題のない生成指示まで弾いてしまうのは使いづらさに拍車がかかっていました。黄ばみの強い「いかにもなChatGPTっぽさ」もまだまだ出るので、それを良いと感じるかどうかは人によるかなと思います。（いらすとやのような素材用途の場合、いかにもAIっぽいのが逆に良いということもあります）

　　　　　　　　　　　　　　いかにもなChatGPTっぽさ

・Seedreamは取り回しの軽さでは随一

Seedream4.5は、なかなか独特のモデルです。まず、4Kサイズの4枚同時生成がクレジット消費なしでできることは圧倒的なアドバンテージ。漫画生成など、非常に創作的なタスクではプロバナナに及ばないのが明らかですが、ちょっとした画像加工やアングル変更などであれば、プロバナナで一発生成を狙うよりも、Seedream4.5で連発ガチャをしたほうが手早く良い結果が得られることも大いにありそうです。

また、顔立ちの維持もかなり高度ではありますが、一方で参照画像に引っ張られすぎるきらいもあり、この点はメリットでもありデメリットでもあるところかと思います。顔立ちは確かに似るのですが、表情が文脈上不自然になることが多いので、あまり一貫性保持力の恩恵を受けにくいかなという印象がありました。顔を似せたいのであれば、普段のSDXLモデルでインペイントしてしまえばよいので、プロバナナ優勢をひっくり返すだけの力は持っていないと感じます。

まとめとして、高級なプロバナナを普段使いできる人なら今後もプロバナナ一択の状況はしばらく続きそうですが、わざわざプロバナナを使うほどでもない軽めのタスクなら、Seedream4.5で「数撃ちゃ当たる」をやるのもよいかな、というのが個人的感想でした。特にアングル変更などはSeedream4.5でも十分できそうな感触がありますね。

＜おわりに＞

このところ、Freepik以外にもSousaku.AIやfal.aiなど、さまざまなトップモデルが使えるプラットフォームが増えてきました。私ははやばやと年払いを決めてしまったため、「Freepik頑張ってくれ！」の一心なのですが、昨日登場したばかりの「qwen-image-layered」が早くもfal.aiで使えるようになったと耳にして、ちょっと妬けています。

qwen-image-layeredは、今回紹介したNanoBananaフォロワー系のモデルとは違い、その名の通り「レイヤー分割」に特化したモデルです。このように、入力した画像を任意の数のレイヤーに分けることができます。