スタジオ真榊

NovelAI新機能「キャラクターリファレンス」登場！再現力はNanoBananaとどちらが上？

Added 2025-09-12 02:39:14 +0000 UTC

2025年9月11日、NovelAIが最新機能「キャラクターリファレンス（キャラ参照）」のプレビュー版を公開しました。NovelAIが学習していないキャラクターでも、参照画像を1枚アップロードするだけで、キャラデザインの一貫性を保って「同キャラ別カット」を生成できる機能です。今回は、こちらの最速レビューをお届けしたいと思います。

(frame embed)

キャラクターの一貫性保持はAIイラストや漫画制作において欠かせない要素。これまでもNovelAIには「ポーション」機能がありましたし、最近はNanoBananaの登場で障壁が一挙に解消されてきたわけですが、キャラクターリファレンス機能にはどれくらいの一貫性保持力があるのでしょうか。一足先に世界を騒がせているNanoBananaとの対決実験を交えつつ、取り回しのコツや使い途をさっそく検証していきたいと思います。

１．キャラクターリファレンスの使い方

キャラクターリファレンスはNovelAIの最新バージョン「NAI Diffusion v4.5」でのみ使用することができます。まずは生成画面左上のモデル選択欄で、「Full」か「Curated」（R-18機能制限版）のどちらかを選びます。

使い方と言っても、あとは生成画面左側のこちらのボタンから画像を読み込ませるだけ。非常にシンプルですね。ポーション機能のようにパラメータを操作する必要もありません。

もちろんimage2imageやインペイントをするときと同様、参照させたい画像を画面上にドラッグアンドドロップして「キャラ参照」を選択することでも起動できます。

・操作できるのは「絵柄参照」のオンオフのみ

画像を読み込ませると、このように「絵柄参照」という入力欄のみが表示されます。

デフォルトではチェックが入った「ON」の状態になっています。この状態だと、キャラクターのデザインとともに、できるだけ画風（タッチや塗り、カラーリング等）も参照画像に寄せて生成することができます。一方、画風は無視して、純粋に服装や髪型のみを模倣したい場合はチェックを外して生成します。

プレビュー版では「読み込ませられる画像は１生成あたり１枚だけ」「インペイント機能との併用不可」「ポーション機能との併用不可」という制限がありますが、逆に言えば、正式版からは複数画像の同時参照やインペイント・ポーション機能との併用が可能になるようです。NovelAI公式によると、「完全版ではより柔軟で強力な機能を追加していく」ということですので、期待できそうですね。ちなみに、プレビュー版でもimage2imageとなら併用することができます。

２．さっそく実践

さっそくキャラクターリファレンスを使った生成を試してみましょう。今回はこちらの、オリジナルキャラクターの鬼怒川あんなさんが普段とは違う魔法少女コスをしている（させられている）イラストを参照させることにしました。普段のシンプルなデニム衣装と違い、記号が多めな衣装デザインですので、顔立ちも含めてどれくらい再現できるか試してみます。

絵柄参照を「ON」にし、プロンプト「1girl」のみで一発生成したのがこちらです。（画像サイズ「大」1024x1536pxで生成）

いかがでしょうか。LoRA学習などと違い、キャラデザの一貫性はかなり取れているように思います。一方、杖のデザインはあまりうまく再現できなかったようですね。これはもしかすると、画面外に見切れていて形状がうまく読み取れなかったのかもしれません。絵のタッチや塗りの方もそこまで強く再現されず、ややNovelAI由来の画風が感じられる結果となりました。

リファレンスさせる画像を変えながら、何度か別Seedで生成し、比較してみます。こちらはいずれも左がリファレンス元画像、右が「1girl」で生成した生成画像です。

やはり、画風は完璧には再現されないものの、衣装デザインや髪型はかなり正確に写し取ることができました。一番下のキャラクターのように、danbooru式のタグではなんとも再現させようのない複雑な衣装デザインでもある程度踏襲できているのはすごいですね。当たり前かもしれませんが、1girlだけの指示では、「同じキャラ」と言えるかはちょっと微妙な結果となりました。

３．「絵柄参照」のオンオフ検証

公式の説明によると、絵柄参照機能が「ON」の状態でも参照画像の画風が完全にコピーできるわけではなく、「髪型や服装、表情といったそのキャラクターらしさを決める特徴に集中して再現する」仕様とのことです。

こちらは絵柄参照機能「ON」の状態で何度か生成したもの。普段のNovelAIと同様、絵柄タグを使わないとこのように毎回絵柄がブレますが、キャラデザ自体はかなり上手にコピーできています。（ただ、胸元のひし形の数が違ったり、首元のデザインがブレたりはしています。手指の描画も微妙）

ここには画像を掲載できませんが、特定クリエイター名のタグと併用すると、キャラデザを維持したまま画風も固定できることを確認しました。ローカル生成のように追加学習やControlnetが使えないNovelAIでは、画風固定にどうしてもこうしたタグを使わざるを得ませんが、ぱっと見て特定のクリエイターを模倣しているか分かってしまうようだと炎上やトラブルのもとですので、使用する場合は十分見た目に気を付けて自衛するようにしてください。

・「絵柄参照」をしなかった場合

一方、「絵柄参照」のチェックを外すと、参照画像の絵柄の影響を最小限に抑え、キャラデザのみに着目した自由な生成ができるようになります。最初の画像で試すと、このような感じになりました。

確かにキャラデザは踏襲されていますが、まるで別アニメになったかのように画風ががらっと変わりました。普段NovelAIで決まった画風を再現できるクォリティタグを使っている場合に、NovelAIが学習していないキャラクターを一貫性をもって再現できる「簡易キャラLoRA」的な使いみちが想定されているものと思います。

もう一度別Seedで生成すると、下図のようになりました。もはやデザインが同じだけの別人ですが、魔法少女の衣装部分は上手に模倣できていますね。ありていに言えば、絵柄参照をオフにしたキャラクターリファレンスは「参照画像のコスプレ風画像」を生成できる機能といった感じでしょうか。

４．どんな画像を読み込ませるべきか

現状のプレビュー版では1枚しか画像を参照させられないので、キャラクターリファレンスを成功させやすくするには、どのような画像を読み込ませるかが重要になります。

公式の説明では、次のようなコツが紹介されています。

①基本的には「シンプルな背景でニュートラルなポーズを取って立っているキャラクターの全身ショット」が望ましい。（※上半身だけを生成したいなら参照画像も上半身だけでOK）

②スケッチやラフ風の画像よりも、線や塗りがはっきりしたアニメ調のような画像のほうが参照しやすい。

③汎用性重視なら、そのキャラを複数の角度からとらえた三面図や設定画風の画像を入力する。画像の隅に顔のアップがあるとさらに効果的。

④なかなか似ない特徴がある場合は、その特徴を示すタグをプロンプトに追加する。（例：tsurimeやthick eyebrowsなど）

背景がごちゃごちゃしていると余計な情報が足されてノイズになってしまいますし、下半身や背面の情報がないと多様な指示にうまく答えられなくなるのは当然のことです。三面図を使って指示したほうがよいのも、NanoBananaに指示するときと同じですね。顔が描かれているサイズが小さくなるほどリファレンスも失敗しやすくなるので、「顔立ちを踏襲したい場合は顔のアップも添えましょう」というのは納得できる説明です。

　　▲全身の三面図だけだと顔の描画範囲が小さくなるので、アップも添える

また、最初に参照させた魔法少女イラストがそうですが、このように極端な表情をしている画像のみを参照すると、普段のニュートラルな顔立ちがどのような感じのキャラクターなのか分からず、再現力が落ちてしまうようです。

こちらの画像のように、複数の表情バリエーションが見て取れる画像を入力したほうが、生成結果も安定することが想像されます。

試しに上のバリエーション画像を参照させて「1girl」のみで生成してみたところ、こちらの画像が出力されました。バリエーションのある顔のアップを入力したことで、これだけでも顔立ちがやや寄ってきたように思います。ただ、そのぶん服装の一貫性は落ちたように見えます。

より特徴を再現したい場合は、鬼怒川さんの要素を構成するタグをたくさん入れて、デザインを補います。普段鬼怒川さんを生成する際に使用している下記のようなプロンプトで生成すると…

このように、さらに一貫性を向上させることができました。

・1枚しか画像がないときは？

キャラクター資料画像を自前で作れる場合はよいのですが、「アップの画像どころか、手元に1枚しか画像がないからキャラクターリファレンスで増やしたいんだよ！」というニーズも多いと思います。以前こちらの特集で試しましたが、たった1枚しかない画像（しかも非常にラフな状態で破綻している）を基にバリエーションを増やして、キャラクターLoRAを作れると、非常に作品作りが楽になるわけです。

1枚の絵から「別カット」を量産してキャラクターLoRAを作る（for illustrious）

こんばんは、スタジオ真榊です。今回は2025年5月現在の環境におけるキャラクターLoRA作りの検証記事をお届けします。具体的には、NovelAI v4の新機能「ポーション」と「ランダムプロンプト」をうまく使うことで、手元に1枚しかないキャラクターの絵を基に構図やポーズの違う「別カット」を低コストで量産し、それらでキ...

上の記事はNovelAI v4の「ポーション機能」を使ってバリエーションを増やしましたが、こちらの画像のように画風の再現度は十分とは言いにくいものでした。（左の1枚絵をポーションして右の6枚を量産）

今回登場したキャラクターリファレンスでは、Preview版の時点で明らかにV4のポーション機能よりも一貫性が上がっていますので、「同キャラ別カット」の用途には向いていると思います。もちろん、NanoBananaでも似たことができるので、いずれも１枚しかないキャラクターのLoRA作りに役立てられるはずです。

正式版で複数画像を読み込ませられるようになったり、参照画像を使ってのインペイントができるようになったりすると、例えば「顔立ちだけを似るまで何度もガチャ」するようなこともできるわけですから、さらに取り回しが良くなることが期待されるところ。ポーション機能も併用できるようになると、さらに画風の一貫性を保てるようになりそうで、今から楽しみです。

５．一貫性保持力はどちらが上？vs.NanoBanana

さて、学習を伴わない一貫性再現と言えば、現在はGoogleの誇るNanoBanana（Gemini2.5 flash image）が世界を騒がせている真っ最中です。スタジオ真榊でもここ３回、NanoBananaを使ってどのように作品作りのワークフローが変化したのかを特集してきたところでした。

【nano banana徹底検証】次世代の画像編集が可能に！「gemini 2.5 flash image」で何ができる？

【2025/08/28更新：検証項目を11から14に増やしました。】【2025/08/29更新：検証項目を14から17に増やし、全体を修正しました。】こんばんは、スタジオ真榊です。今回は2025年8月26日にデビューしたGoogleの画像生成特化型マルチモーダルモデル「gemini 2.5 flash image」の実力検証です。コードネーム「nano banana...

これまでのNanoBanana検証では、「絵柄模倣は完璧ではないものの、コツをつかめばかなり一貫性を保てる（ことがある）」ーというのが率直な感想。先ほど触れた「1枚から学習用素材を量産」したり「同キャラ別カット」を生成したりする用途なら、NanoBananaのほうが無償で使えるから良いのではないか？という考えも浮かぶところです。そこで、NanoBananaとNovelAI「キャラクターリファレンス」の一貫性保持力を比較するため、対決型の比較実験を行ってみました。

・対決条件

NanoBananaは自然言語で指示できますが、NovelAIはdanbooruタグ型が基本です（英語の自然言語もある程度は理解できますが）。できるだけフェアな対決になるよう、使用するプロンプトの条件を次のように揃えました。

NovelAI：「1girl,sitting on chair,embarrassed,classroom,double v」

NanoBanana：「このキャラクターがいすに座り、恥ずかしそうな表情で両手でピースしてこちらを見ている別カットを生成してください。背景は教室。キャラクターの画風を再現し、同一人物として描いてください。画像のみで返答してください。」

NovelAIは画像サイズ「大」（1024x1536px）で、「絵柄参照ON」とします。いずれもガチャは１回のみ繰り返し、生成結果2枚をそのまま載せます。

対決１：鬼怒川さん

【参照画像】

【生成結果】NanoBanana

【生成結果】NovelAI（キャラクターリファレンス）

【講評】

初回からかなり残酷な結果となりました。NanoBananaバカ強え！

特にポーズやシチュエーションを指示しなかったこれまでの生成例と異なり、読み込ませた画像と違うポーズや背景を指示したことで、それぞれの実力が一発で露わになった感じですね。NovelAIは画風タグを使ったり、サイズを大きくしたりすることで品質がどんどん上がっていくので、このレギュレーションでは少し実力が出しきれない部分もあるかもしれません（擁護）

NanoBananaは、同じプロンプトだとあまりガチャをしても構図に変化が見られない特徴がみられます。チャットルームを変えると内部的にシード値が変わるのか、また違う結果になりやすいようです。

対決２：ミナちゃん

【参照画像】

【生成結果】NanoBanana

【生成結果】NovelAI（キャラクターリファレンス）

【講評】

こちらも先ほどと変わらない結果となりました。背景を教室にしたのは、モデルの実力が如実に出るモチーフだからです。独特の椅子や机のデザイン、黒板と窓の配置や机の向きが整然としているか、小物はどんなものがあるか等、不自然なところが少しでもあればすぐに見抜けてしまうのですね。

御覧のように、NanoBananaはキャラの一貫性もそうなのですが、ともかくそうした現実のモチーフをしっかり描き出すことが非常に得意です。キャンバスサイズの自由が利かない分、画質や描き込みはローカルモデルやNovelAIに劣るのですが、正確性については圧倒的な実力を備えていることが分かります。

対決３：青肌ヴァンパイア娘

参照画像：

【生成結果】NanoBanana

【生成結果】NovelAI（キャラクターリファレンス）

【講評】

こちらはやや意地悪な題材でした。赤い空＋蒼白肌というかなり非現実的なモチーフでしたので、NanoBananaもNovelAIも、普通の肌の女の子が特殊なライティングで描かれていると判断したようですね。NovelAIは背景が夕方っぽくなり、参照させた画像の背景情報を継承してしまっていることを感じさせます。やはり、参照させる画像は特殊なライティングと感じさせないような、ニュートラルでシンプルな画像を選んだ方がよいようです。

考察

これらの対決を通じて感じ取れるのは、キャラクターリファレンス機能のあれこれというよりも、まずはNanoBananaの圧倒的な再現力と応用力の高さでしょう。ややNovelAIには可哀想な結果となりました。というのは、世界知を持ったLLM（Gemini）による手助けがないナマのt2iモデルであるNovelAIが実力を活かすには、どうしても人間によるプロンプト補助が不可欠だからです。

例えば最後のヴァンパイア娘の場合、次のように容姿の情報をタグで補ってやりますと…

このように、かなりましな結果にすることができます。

NanoBananaの場合はGeminiが入力画像の文脈を読み取り、内部的に画像生成作業を統括・補助してくれているのでしょうから、NovelAIの場合は人間がここまでサポートしてあげてようやくフェアだったかもしれません。とはいえ、キャラクターの一貫性も教室の描写力も擁護の余地がないほど圧倒的にNanoBananaが上回っており、Preview版の現状ではややNovelAI（キャラクターリファレンス）にとって厳しい結果となりました。

６．NanoBananaとの使い分けを考える

では、絶対王者NanoBananaの前では、キャラクターリファレンスの出番はもはやないのか？というと、決してそんなことはないように思います。

NovelAIにはNovelAIで、インペイント能力の高さやR-18プロンプトへの対応力、幅広い学習内容など、NanoBananaにはないさまざまな強みがあります。そもそも、普段からNovelAIを中心に作品作りをしている方にとっては、ポーションより強いキャラ参照機能の導入で大いに恩恵が得られるでしょう。

インペイントについて言えば、もちろんNanoBananaも文脈を踏まえた「描き替え」はかなり上手にできるのですが、一か所だけを任意に書き換えたいのに別の部分を差し替えてしまったり、キャンバスサイズに限界があるために、狭い範囲に描かれたものはどうしても細部が甘くなってしまいます（▽）。

その上、入力画像のおっぱいがちょっとデッカかったりするだけですぐエラーを吐くので、叡智方面の生成にはほとんど使えないと言ってよいでしょう。（🍌のくせに…！）

例えば、NanoBananaで出した画像が解像度が低すぎる場合、できれば細部を補いつつアップスケールしたいわけですが、ローカル生成ではアップスケール時に別の要素を付け加えてしまう（描かれたものが変容してしまう）悩みがあります。こうしたときに、NovelAIでキャラクターリファレンスを掛けつつ、より大きなサイズにimage2imageするというのはどうでしょうか。

NanoBananaにこのような指示をして、歩道橋の上にミナちゃんを立たせたとします。

指示：1枚目の画像の歩道橋の上に、2枚目の画像の女の子を描いてください。女の子は歩道橋から上半身を乗り出し、こちらに向かって笑顔で手を振っています。空中に浮かんでしまわないよう、前後関係を注意してください。画像のみで返答してください。

非常に狭い範囲に描かれるので、ミナちゃんをアップにするとこのような感じになっています。

Preview版ではインペイントとの併用がまだできませんが、こうしたときに、キャラクターの容姿をリファレンスさせて、元画像のキャラ部分だけをフォーカスインペイント（ADetailerのように拡大生成してはめ直す技術）ができれば、NovelAIでNanoBananaの足りない部分を上手に補えるのではないでしょうか。

また、NanoBananaには絶対にできない用途として、「同キャラ別カット」ならぬ「同キャラエロカット」があります。本来は複数のカットを用意して自前でLoRAを学習させないとなかなかできなかったわけですが、NovelAIにちょっと参照させるだけでこれができるのは画期的ですね。これまでのポーション機能でも似たことはできましたが、明らかに一貫性はこちらの方が向上しています。

正式版のキャラクターリファレンスが出てみないと最終的な評価は下せませんが、NanoBananaも万能ではない以上、今後もNovelAIの有用性は揺らがないものと思います。

先日もXで「NanoBananaでR-18生成はできるんですか？」という質問を頂いたばかりですが（残念ながらできません）、R-18どころかちょっとセンシティブな要素が加わっただけで画像生成を断られてしまうようだと、ツールとしては使いにくい限りです。画像生成の用途は人それぞれなわけですから、それぞれのモデルでできること・できないことをよく見分け、使い分けや組み合わせによって自分にとって最も使いやすいものを選ぶのがよいかなと思います。

それでは午前3時を回りましたので、今夜はこのへんで。スタジオ真榊でした。