依拠の類似(1)

依拠の類似を生成AI出力画像から見つけるいくつかの方法(1)

2025年12月1日
鈴木健治

 この記事は「生成AIによる無断学習をどんどん禁止する」Advent Calendar 2025に参加しています。
https://adventar.org/calendars/11528 (opens in a new tab)

1. 趣旨

 著作権侵害の要件として、表現が似ているかどうかの類似性がある。この類似性とは別に、その表現を知りながら創作したとのかどうかという依拠性がある。権利者の作品とは独立して創作し、たまたま類似する場合には、著作権の侵害にはならない(特許は審査されるためたまたま似ていても侵害になる)。
この依拠性の証明責任は権利者(原告、クリエーター)にある。
2023年ごろから、短文SNSサービスであるXを中心に、多くの生成AI出力画像を対比してきた結果、依拠の間接事実となる罠(トラップ)と同様に機能し得る表現が、生成AI出力画像に残存するある種の傾向を発見した。特に、Stable Diffusion系の潜在拡散モデルでは、表現の不連続な部分が同じ場所に再現する、というトラップが残存する。その考え方と方法を報告する。

2. 依拠の類似とは

 この依拠性の要件は、条文での明記はないが、「別個独立してたまたま類似の著作物が創作されたような場合には、これを利用しても著作権侵害とならない」(田村善之『著作権法概説 第2版』(有斐閣、2001)第48頁)という要件である。最判昭和53.9.7[ワン・レイニー・ナイト・イン・トーキョー]も「著作物の複製とは、既存の著作物に依拠し、その内容及び形式を知覚させるに足りるものを再製することをいうと解すべきである」と説示する。

 生成AIの出力画像については、AI利用者(生成AIユーザー)が既存の著作物を認識していなかったが、AI学習用データに当該著作物が含まれる場合、その著作物へのアクセスがあったため、通常、依拠性があったと推認される(文化審議会著作権分科会法制度小委員会「AI と著作権に関する考え方について (opens in a new tab)」(2024)第34頁)。

 また、田村善之教授は、創作をコントロールしているのはAIなのであるからAIが学習していれば依拠は推認されると説示する(田村善之「生成AIをめぐる著作権法の課題 (opens in a new tab)」(知的財産法政策学研究, 70, 13-102, 2025年6月)第43-44頁。

 そして、権利者が依拠の類似の主張をしやすくするように、罠(トラップ)を表現に忍ばせることがある。依拠を認定する方法の一つとして「依拠の場面では、創作性ある表現が同一である必要はなく、誤記が共通する事実や、無断複製物発見用の罠(トラップ)又は電子透かし(デジタルウォーターマーク)が再現されている事実は、依拠を推認させる有力な間接事実である」(多数の判決を引用しつつ、髙部眞規子『実務詳説著作権訴訟 第2版』(きんざい、2019)第252頁)。

 創作的表現が似ているという類似性以外に、依拠があることを示唆する「依拠の類似性」があり、トラップの共通もその一つである。従来、トラップとしては、「プログラムや地図等においては、敢えて組み込んでおいた無害の不要なもの(罠)までが複製されている場合には依拠音有力な証拠となる」(中山信弘『著作権法』 第4版(有斐閣, 2023)第741頁注17)。

3. 潜在拡散モデル

 以下、Stable Diffusionを使用した画像処理の研究論文の題材を参照しつつ、依拠の類似を説明する。
図1は、左側がバックトゥザフューチャー (opens in a new tab)(Universal Pictures)、右側がリック・アンド・モーティ (opens in a new tab)(Adult Swim)であり、潜在拡散モデルの機能を用いて両者の補完画像を生成させている。

Wang and Golland [2023]Fig.1より

 図1 潜在拡散モデルの生成AIによる画像処理例

 この補完の過程は、生成AIによる修正・補正や補完が可視化させるため、生成AIが学習した画像と出力した画像との関係性を可視的に吟味する上で最適である。
強い表現は、例えば、図1右側の黄色い服のモーティにかかるシートベルトや、バックトゥザフューチャーのブラウン博士が持つリモコンのアンテナなど、周囲と異なる存在で、明暗や色差があり、直線や曲線を横断する方向では微分できないような不連続な表現である。不連続な表現は、拡散モデルで原画像にノイズを加えても最後まで残りやすく、パラメーターに影響を与えやすい。

Wang and Golland [2023]Fig.1より拡大

 図2 図1の一部拡大

 図2の符号1で示すように、背景の運転シートやハンドルが消失しても、ベルトが残っている。この図2の画像でシートベルトがあることは奇妙であるが、生成AIがコントロールする表現には意味的に不整合で、美的にもストーリーとしても必然性のない原画像の強い表現が残存する。図2の符号2は、この表現だけみると光線のようだが、図1のアンテナの残存として観察すると、位置、形や方向が同じである。
このような不連続な強い表現が生成AI出力画像に残ることは、AIシステムが原画像を学習した証拠となる。つまり、原画像の不連続な強い表現はトラップ(罠)であり、意味を考えずに表現をコントロールした(または本当はしていない)主体が、人間であるか生成AIであるかを問わず、依拠したという間接証拠となる。
図3は同じ補完を扱った別の著者による論文であるが、その後の生成AIの進化によりアンテナの残存表現は消失している一方、ベルトは残っている。

Cao et al. [2025] Fig.4より

 図3 図1の素材を扱った他の例

図4は、先の論文にある別の画像で、左側がArya Stark役のMaisie Williams (opens in a new tab) (MARC HOM for EW)、右側がArya Stark (opens in a new tab)のキャラクター表現である。

Wang and Golland [2023]Fig.A.1

 図4 「不連続トラップ」による依拠の類似が観察される例

 最も右の図の背景に、いかだか船のような茶色い物体が水平に並んでいる。これが剣として解釈され始め、右から2番目では人体を貫いている。画像中の位置が同じところに、ほぼ同じ輪郭で存在し、生成AI出力画像の全体の文脈では剣の可能性が高いのかも知れないが、しかし、姿勢や顔の表情とは矛盾するほどに致命的な位置に刺さっている。同位置で輪郭も一致するため、依拠の類似であるといえる。生成AI出力画像にある矛盾、唐突感、不自然さはこの不連続物体がもたらす依拠の類似によることが多い。

 図4の真ん中の生成AI出力画像を被疑侵害画像として、右の著作物に依拠していることを立証するために、この依拠の類似の考え方を使うことができる。
まず、生成AI出力画像に矛盾する表現を探る。表情や姿勢や出血量と、心臓近くを貫く険の表現は矛盾する。または、唐突感がある。この剣の形状と位置に注目して、著作物との一致点をみると、不連続な色彩で描かれた茶色い物体があり、この物体の表現が「不連続トラップ」であり、生成AI出力画像に残存した可能性を検討できる。この原著作物を学習していなければこの生成AI出力画像の表現にならない、という程度に位置や輪郭が一致していれば、依拠の類似が存在する根拠となる。

 生成AI出力画像に残存する表現を一つの根拠として依拠の類似を肯定できる場合、その生成AIシステムが原告著作物を学習したという事実認定がなされたと等しいと考えられる。学習するための対価を支払うことなく、原告著作物を学習し、その影響の強い生成AI出力画像を出力しているのである。
このとき、仮に、入手できた被疑侵害画像自体は、著作権法上の類似性の範囲外としても、対価を支払わずに、原告著作物そのものを学習のために複製・翻案した事実を認定しながら、学習を許諾する際に求める対価を損害額できない制度で良いのだろうか。

 学習するためには正当な対価を支払うことが通常となっていくのに、訴訟でその損害額を請求できないのであれば、日本だけが学習の対価市場が形成されず、公正な競争環境を得られなくなってしまう。

 本稿の後半は、別の論文も参照しつつ、連続を扱う拡散モデルと、不連続を扱う大規模言語モデルの融合が進むことで、この依拠の類似の傾向がどう変化していくかを考察する。

(参考)
Wang, C. J., & Golland, P. (2023). Interpolating between Images with Diffusion Models. arXiv preprint arXiv:2307.12560 [accessed December 1, 2025]. https://doi.org/10.48550/arXiv.2307.12560 (opens in a new tab)

Cao, Y., Si, C., Wang, J., & Liu, Z. (2025). FreeMorph: Tuning-Free Generalized Image Morphing with Diffusion Model. arXiv preprint arXiv:2507.01953.[accessed December 1, 2025] https://doi.org/10.48550/arXiv.2507.01953 (opens in a new tab)