ドイツの音楽著作権管理団体であるGEMAが、ChatGPTの運営元であるOpenAIを相手取りミュンヘン第一地方裁判所へ提起した訴訟において、GEMAが求めていた差止、情報開示、および損害賠償の請求を実質的に認める広範な勝訴判決を下した。初めてのOpenAIの敗訴ということでも重要であるが、さらにこの判決は生成AIの学習(トレーニング)と出力の双方において著作権の侵害性を認める極めて重大な判断を示しており、地裁判決と言えども影響を軽くみるべきではないのだろう。
この訴訟は大量のデータスクレイピングという抽象的なものを対象とするのではなく、GEMA側が選択したドイツ国民がよく知っている9つの楽曲に絞って単純なプロンプト入力によって出力として歌詞が現れるかを訴訟の客体としており、これまでの米国でよく見られたふんわりとしたAIモデルのトレーニングにおける間接的な侵害を争うものとは大分様相が異なる。なお、この原告のやり方は米国のような強い証拠開示請求制度が存在しない法域においては出力として動かぬ証拠を握るということであり、非常に効果的であるとは個人的に思う。
裁判所の判断であるが、まずモデルの学習段階において複製権の侵害を認定している。係争中の歌詞が出力に現れることで「再現可能な形で含まれている」との認定に基づき、歌詞がモデルの「指定されたパラメータ内のデータ」として「具現化」されているという認定したのである。要するにモデルのウェイトも法的には「複製」に該当し得るという判断である。これは従来のAIモデルの開発ベンダー側の感覚からすれば非常に厳しい。これについて、OpenAIは技術的に抽象的パターンに過ぎないとする従来からの論を展開したようであるが、裁判所は出力における歌詞の正確な同一性を証拠としてモデル内への「記憶」として認定し、OpenAI側の「新たに生成した」という主張に対しては歌詞の長さと複雑性を考慮して「偶然の一致」という反論も排除している。
学習面だけでなく出力においても裁判所は別個に送信可能化権を侵害したと認定している。つまり、OpenAIがChatGPTを介して歌詞を出力し、公衆であるユーザーが個別にアクセスできるようにした行為そのものが侵害ということである。個人的な感想としては、この学習と出力での二重の侵害認定は非常に重いと感じている。仮にOpenAIが今回の判決を不服として控訴したとしても、学習面での複製権侵害と出力の送信可能化権侵害の両方を覆さなければならない。今のところは自分からはそこそこ堅実なロジックに基づいているように見えるので、全ての判断を覆すのは難しいだろう。
EU域内ということでOpenAIはEU DSM指令のTDM例外に該当するという反論を行なっているが、権利団体側のGEMAが歌詞のオプトアウトをしていたという事実が認定されたことでそもそもTDM例外の主張が崩れたのだが、さらにその前段として単なる「分析」を超え、作品を「記憶」した後で「出力」する形で利用することは、TDM例外が保護する目的の範囲を根本的に逸脱しているという画期的な判断も地裁側は行なっている。
ただし、ミュンヘン地裁は根本的なEU DSM指令の解釈に触れると考えられる問題について欧州司法裁判所に付託しないという判断を行なっていることは今後特に控訴審において問題視されるかもしれない。ミュンヘン地裁的にはそもそもOpenAIの行為がEU DSM指令のTDM例外が許可する目的の範囲外なのでそもそも付託する理由がないというロジックなのではあるが、個人的にはやはり前例のないEU法の解釈なのであるので欧州司法裁判所に付託して判断を仰ぐべきだったのではないかと思う。ただし、この判断の法的な是非については自分は特にEU法を知らないので何とも言えない。
また、出力の責任がプロンプトを書いたユーザー側にあるというOpenAI側の主張については、OpenAIがトレーニングデータとして歌詞を選択し、モデルアーキテクチャを設計し、トレーニングデータの記憶に責任を負っているとして地裁は否定している。ユーザーのプロンプトはあくまで引き金であって原因ではない論である。この点についてはある程度は仕方がないだろう。
今後であるが、OpenAIは間違いなく控訴すると考えられるが、やはりAIモデルを「法的な複製」とみなす論は崩されやすいように感じている。英国のGetty v. Stability AI訴訟でまさにここをOpenAIの言う「確率的合成」とみなしたばかりでもあり、国際的な判例との齟齬を突きやすい。しかしながら、地裁判決とは言え、包括的なライセンスモデルを推進していた権利者団体側がここまで綺麗に完勝した事実は大きそうだ。Web上のデータは無料の訓練素材という考え方は少なくともEUでは厳しい傾向になるのではないかと思う。
なお、法管轄について裁判所としては侵害行為の一部あるいは侵害の結果がドイツ国内で発生しているという判断から終始ドイツ法とEU法で判断を行なっているが、送信可能化権の侵害については結果発生地とする考え方もあるのでまだ分かるとしても、複製権侵害についてはOpenAIのモデルトレーニング時における複製行為は全て米国であろうからここが控訴審で争点になるかもしれない。判決文によればOpenAIはドイツ国内を含むEEA域内のサーバーでもモデルを提供していると認定されており、ミュンヘン地裁はEU域内のサーバーにモデル又は結果物が保存された時点でEU法の管轄という判断を下したのだろうが、開発段階の複製が米国のみであった場合の法的評価などは今後の争点になり得る。
ただ、仮に今回の地裁の解釈がそのまま一般化するとEU域外のAI事業者にとってはEU域内へのAIサービス提供は常にリスクがあるということになる。今回の判決ロジックをそのままEU全域で維持となると、単なるWebのサービスならEUを遮断すれば良いが、モデル単体や出力の欧州への流入まで遮断という話になりかねないだろう。逆にEU市民からすると、AIトレーニング用のデータだけを域外のAI企業に不当に搾取されているという感覚が増幅しそうであり、今後の政治的な火種になるかもしれない。
脱線したのでいったん戻ると、自分はドイツ法にもEU法にも詳しくはないものの、今回のミュンヘン地裁判決は個人的には若干攻め過ぎなようにも思い、控訴審あるいは欧州司法裁判所あたりでこの「管轄問題」、「TDM例外の解釈」、あるいは「記憶の複製理論」があらためて争点になるかと思う。なお、特に複製行為に関してはOpenAIとしてはやはり米国で技術的には完了しているわけであり、それを欧州に持ち込むことの是非というあたりで政治的な判断も入ってくるんじゃないかと思うところもあり、司法だけではない動きも誘発する可能性があるだろう。色々エスカレートしていくと、GDPRやDSAなどの強い規制法と同じ理屈がAI領域で強まるかもしれない。
個別の訴訟としてみると、今回は原告のGEMAがドイツで有名な9つの楽曲を選んで単純プロンプトで出力させ、その侵害の認定はわずか15語とか25語のごく短い歌詞の出力でされているわけである。短くても個性が強く表れた創作性の高い部分をうまく選んだことがGEMA勝訴の要因の一つであるだろう。この単純プロンプトのみで独創性が極めて高い著作物の一部を出力させてそれを証拠とする手法は、米国のような強い証拠開示請求の制度がない法域であることを逆手に取った戦略とも言え、これは他の法域でも類似の訴訟を誘発するかもしれない。なお、今回の訴訟も結局のところ歌詞のデッドコピーそのものがAIの出力によって現れたことから全てが推認されているわけであり、これは日本法的言い回しであれば著作権法30条の4の情報解析の例外規定における「非享受利用」の範囲に該当しないということでもあろう。各国の法のアプローチは異なるものの、モデルの出力とその利用の目的での判断を重視するのは各国の訴訟で共通していると考えられ、少しずつ各国の考え方のすり合わせが進んでいるようにも感じられる。その意味では、日本の著作権法の非享受目的の概念は先進的だったと言えるのだろう。
注:この投稿はXへ投稿した同様の内容のスレッドを編集したものである。元がXのスレッドなので雑多にあちこちへ飛んでいるが、あまり気にしないこと。
