OpenAIの「GPT Store」が著作権を巡る新たな火種を生んでいる

デンマークの出版社が、同社の著作物を無断使用して作成されたボットがGPT Storeにあるとして、OpenAIに対しいくつかのボットの削除を求めた。OpenAIはほかの著作権者からも同様の訴えを受ける可能性がある。
Illustration of a file drawer opening out of a robot head with one folder labeled with the copyright symbol
Illustration: Jacqui VanLiew; Getty Images

デンマークの教科書を手掛ける会社Praxisで出版ディレクターを務めるモーテン・ブリッヒフェルト・アンデルセンは、数カ月前からOpenAIのGPT Storeに掲載されているチャットボットを詳しく調べるようになった。

GPT Storeは特定の機能のためにつくられたボットのマーケットプレイスだ。1月に開設されて以来、便利なものから風変わりなAIツールまで、たくさんのものが掲載されるようになった。コミック風イラストの生成ツールは、雑誌『「ニューヨーカー』風のイラストや色鮮やかなアニメ調のイラストを生成することができる。プログラミングや執筆の支援ツールは、コードや文章を効率的に書く助けを提供する。ほかにも色の分析ボットクモの識別ツール、デートに特化したコーチングを提供する「RizzGPT」と呼ばれるツールも存在する。とはいえ、ブリッヒフェルト・アンデルセンが探しているボットは特定のものだ。それは、著作権で守られている自社の教科書を無断で使用し作成されたボットだ。

ブリッヒフェルト・アンデルセンが勤めるPraxisは、AIの導入に積極的で独自のカスタムチャットボットを作成したこともある。しかし、いまはGPT Storeのもぐらたたきに注力しており、彼がそのもぐらを叩く係を担っているというわけだ。

「著作権を侵害しているボットを個人的に探して報告していました」とブリッヒフェルト・アンデルセンは話す。「そのようなボットが次々と現れるのです」。教科書の内容をアップロードしている犯人は主に若者で、クラスメートと共有するためにカスタムボットを作成していると彼は推測している。また、いままでに発見した著作権侵害にあたるボットは全体のほんの一部に過ぎないという。「氷山の一角です」とブリッヒフェルト・アンデルセンは話す。

著作権を侵害しているボット

GPT Storeのボットの説明文から、著作権で守られているコンテンツが何らかのかたちで利用されている可能性があるものを見つけることは簡単だ。『Techcrunch』は先日、OpenAIのGPT Storeは「スパム」で溢れていると報じた

著作権で保護されているコンテンツの無断使用は特定の用途においては許されているが、それ以外の用途で使われているものに対して著作権者は法的措置をとることができる。『WIRED』が調べたところ、ドラマ『ゲーム・オブ・スローンズ』の作者であるジョージ・R・R・マーティン風の文章を「書く」ことができると謳う「Westeros Writer」というGPTを見つけた。作家マーガレット・アトウッド風の文章を書くボット「Voice of Atwood」や、スティーブン・キング風の文章を書くボット「Write Like Stephen」などもあった。

「Write Like Stephen」のボットをだまして、回答の方向性を指定している「システムプロンプト」を開示させようと試みた。するとボットの回答から、キングの回顧録である『On Writing』のデータが使用されていることが判明した。指示に応じて「Write Like Stephen」は、その本の一節を原文のまま出力し、その文章が書かれているページまで回答したのだ(メールアドレスや電話番号、外部のSNSのプロフィールなどの連絡先情報が提供されていなかったので、ボットの開発者と連絡をとることはできなかった)。

OpenAIは著作権で保護されているコンテンツを使って作成されたGPTに対する削除要請に応じていると、同社の広報担当者は話す。しかし、そうした要請にどれほどの頻度で対応しているかという質問には回答しなかった。ただし、同社は問題のあるGPTを積極的に探していると付け加えている。「自動システムと人間によるレビュー、ユーザーからの報告をもとに、OpenAIの利用規約に違反する可能性のあるGPTの特定と審査をしています。これには無断で第三者のコンテンツを使用しているGPTも含まれます」

アップロードされた追加情報

OpenAIはすでに法的な問題を抱えているが、GPT Storeの著作権を巡る問題は訴訟のさらなる火種となる可能性がある。同社は現在、著作権侵害を訴える注目度の高い訴訟に直面している。これには『ニューヨーク・タイムズ』や、ジョージ・R・R・マーティンなどの有名作家を含むフィクションおよびノンフィクションの複数の著者団体が起こしたものも含まれている。

GPT Storeで提供されるチャットボットは、外部の開発者が独自の機能をもたせて作成したもので、OpenAIが開発しているChatGPTと同じ技術が使用されている。開発者はボットをカスタマイズし、OpenAIの技術に組み込まれている知識を“拡張”するために追加の情報をアップロードできる。この追加情報を参照してユーザーの質問に応答する技術は、検索拡張生成(Retrieval-augmented Generation、RAG)と呼ばれる。そしてGPT Storeのボットを構成しているRAGファイルには、著作権者の許可なしにアップロードされた、著作権で保護されているコンテンツが多く含まれていると、ブリッヒフェルト・アンデルセンは考えているのだ。

OpenAIのGPT Storeの利用規約は、「必要な許可なしに第三者のコンテンツを使用する」ことを明示的に禁止している。しかし、いまのところGPTを作成する開発者によって著作権で保護されているコンテンツがGPT Storeにアップロードされたかどうかを外部の人間が確認できる方法はない。つまり、著作権侵害をされているかもしれないと懸念する著作権者は、その証拠を自ら探さなければならないことを意味する。

ブリッヒフェルト・アンデルセンは所属する会社の出版物の内容が使用されている可能性のあるチャットボットを見つけるために、キーワードを使ってGPT Store内を検索した。Praxisの出版物の内容を使って訓練されたものであるかどうかを突き止めるためには、そこからさらにそれぞれのボットと会話をしなければならない。これは手間のかかる作業だが成果は得られている。複数のボットでPraxisの教科書にある一節を回答させることができたのだ。「正体を暴くには、言語モデルをだます必要があります」と彼は話す。

OpenAIが自社システムの訓練のために、著作権で保護されたコンテンツを無断でスクレイピングし、使用したことに関する訴訟は解決までに数年かかる可能性がある。しかし、GPT Storeにアップロードされたコンテンツに関する申し立ては、より直接的な影響を及ぼす。

「GPTは、著作権におけるOpenAIとユーザーの関係に重要な変化をもたらしました」と、コーネル大学のインターネット法の教授、ジェームズ・グリメルマンは話す。例えば、YouTubeが一般のユーザーによる動画の公開を認めているのと同じように、オンラインプラットフォームがユーザーに独自のコンテンツのアップロードを認めている場合、そのコンテンツはデジタルミレニアム著作権法(DMCA)の対象となる。DMCAは、著作権者が自身の知的財産が無断でオンラインに掲載された場合に掲載の取り下げを要請できる米国の著作権法のひとつだ。

例えば、ユーチューバーが使用するためのライセンスを取得していない音楽を含む動画を投稿した場合、音楽レーベルはプラットフォームに通知して、掲載を取り下げてもらうことができる。GPT Storeも、開発者が独自の作品をアップロードできる仕組みであることから、この法律が適用されるというわけだ。

DMCAに基づくボットの削除要請

海賊版の防止のために制定されたデジタルミレニアム著作権法は、いまや著作権保護において非常に重要な役割を担っている。著作権者がDMCAに基づく削除通知を送ることで、自分の作品が許可なくオンラインに掲載された場合、速やかに取り下げるよう要請できるからだ。

ブリッヒフェルト・アンデルセンが、GPT StoreでPraxisの教科書の内容を勝手に使っているボットを初めていくつか見つけたとき、DMCAに基づきボットの取り下げをOpenAIに要請した。しかし、クリエイティブ関係の労働者の利益を守るデンマークの権利団体「Danish Rights Alliance(DRA)」に彼が助けを求めるまで、OpenAIから返答はなかったという。

DRAは積極的なアプローチをとりながら、AI時代における加盟者の著作権を守っている。DRAは昨年、DMCAに基づく掲載の取り下げを要請し、生成AIの訓練に使用された19万6,000冊以上の書籍を一時的にインターネットから取り下げたのだ。

関連記事:20万冊の本をスクレイピングしたBooks3、その訴訟がAIのあり方を永遠に変える可能性

DRAのコンテンツ保護と執行の責任者であるトーマス・ヘルドルップはAI企業とのこうした戦いをしばしば率いており、GPT Storeへの対処においても中心的な役割を果たした。Praxisの代わりに苦情を申し入れたことで、OpenAIは出版社が著作権を侵害していると指摘するボットの削除に動いたのである。

「報告した著作権侵害にあたるGPTを、OpenAIはかなり迅速に削除しました」とヘルドルップは語る。とはいえ、OpenAIにはさらなる対策を望んでいると話す。「著作権者が著作権侵害にあたるGPTを探すのに使える、よりよいツールが必要です」と彼は言う。

GPT Storeの状況が改善されない場合、PraxisはOpenAIに対して法的措置をとることを検討するとブリッヒフェルト・アンデルセンは語る。例えば、YouTubeは著作権で保護されているコンテンツが使われないようにするために「Content ID」というシステムを導入している。これと同じように、OpenAIやほかのAI企業が、アップロードされたRAGコンテンツに著作権で守られているものがないかをスキャンできる、より堅牢なシステムを導入することを期待していると彼は話す(OpenAIに対して、Content IDのようなシステムを導入する予定があるかどうかと質問したところ、同社の広報担当者は直接的な回答はしなかったものの、GPTを積極的に審査していると語っていた)

著作権侵害にあたるチャットボットの発見を助けるツールを開発し、AI企業に提供しようとするスタートアップも登場している。Patronus AIの創業者兼CEOであるアナンド・カンナパンは、最近立ち上げた著作権で保護されているテキストを検出するサービス「Copyright Catcher」は、カスタマイズされたGPTの潜在的な著作権侵害を「必ず」検出できると主張している。

フェアユースの範囲内なのか

OpenAIは、GPT StoreのGPTに対するDMCAに基づく削除要請に応じている。とはいえ、同社はフェアユースを主張することで、著作権に保護された作品を使用する一部のGPTを守ることができるだろうと、知的財産の専門家は主張する。

「許可なく著作権で保護されたコンテンツはすべて、こうしたツールにアップロードできないとするのは、非常に性急だと思います。教育や研究といった非常に重要な使い方ができなくなってしまうからです」と、 American University Washington College of Lawの著作権およびオープンライセンスのプロジェクトディレクター、メレディス・ジェイコブは話す。学生が教科書の内容を理解するのを助けるGPTの作成はフェアユースで守られる使い方だと、ジェイコブは考えている。

GPT Storeのボット用の補足ファイルに何がアップロードされているかを外部の人間が簡単に確認できない限り、著作権者はOpenAIの自動システムが違反を捉えてくれることを信頼するか、疑わしいボットを個別に調査するという手間がかかる手法をとらざるをえない。「干し草の中に落ちた1本の針を探すような作業です」とブリッヒフェルト・アンデルセンは話している。

(Originally published on wired.com, translated by Nozomi Okuma)

※『WIRED』による著作権の関連記事はこちらChatGPTの関連記事はこちら


Related Articles
Laptop on a white and dark grey surface with yellow 3D chat bubbles floating around it
ChatGPTでカスタマイズしたチャットボットの「GPT」をほかのユーザーに公開できるようになった。これはアップルのApp Storeと同じような仕組みで、近いうちに作成したチャットボットから収益を得られるようになる見込みだ。ここではGPTのつくり方のヒントと公開方法を説明する。
3D render of desktop computer with a webpage and a store awning protruding from the screen
カスタマイズされたチャットボットのアプリストアである「GPT Store」が1月10日にオープンし、ChatGPT有料版ユーザーが利用できるようになった。しかし、カスタムチャットボット制作者への報酬がどうなるのかについて、OpenAIははっきりした方針を打ち出していない。
overhead view of an arrangement of books slightly opened and resting on a table
「Prosecraft」という文学の分析サイトが、作品を無断使用されたという作家たちの反発を受け、閉鎖に追い込まれた。この出来事は著作権侵害の問題であるのと同時に、AIツールを使って人間の仕事を置き換えようとしている企業から主導権を奪い返そうとするクリエイターたちの動きが強まっていることも示している。

雑誌『WIRED』日本版 VOL.52
「FASHION FUTURE AH!」は好評発売中!

ファッションとはつまり、服のことである。布が何からつくられるのかを知ることであり、拾ったペットボトルを糸にできる現実と、古着を繊維にする困難さについて考えることでもある。次の世代がいかに育まれるべきか、彼ら/彼女らに投げかけるべき言葉を真剣に語り合うことであり、クラフツマンシップを受け継ぐこと、モードと楽観性について洞察すること、そしてとびきりのクリエイティビティのもち主の言葉に耳を傾けることである。あるいは当然、テクノロジーが拡張する可能性を想像することでもあり、自らミシンを踏むことでもある──。およそ10年ぶりとなる『WIRED』のファッション特集。詳細はこちら