裁判官、著作権訴訟でOpenAIに2,000万件の匿名化されたChatGPT会話の開示を命令

ニューヨーク南部地区連邦地裁の裁判官は、進行中の著作権訴訟における重要な進展として、OpenAIに対し、ニュース組織の連合に2,000万件の匿名化されたChatGPTの会話ログを提出するよう命じた。

シドニー・H・スタイン地区裁判官は、オナ・T・ワン連邦治安判事による先の判断を支持し、ユーザーのプライバシーを理由に開示を制限しようとするOpenAIの試みを退けた。

この命令は、ニューヨーク・タイムズやシカゴ・トリビューンを含む主要なコンテンツ制作者が提起した16件の著作権訴訟を統合した案件に端を発している。

原告らは、OpenAIが自社の人工知能モデルの学習のために、著作権で保護された作品を違法に使用したと主張している。

このディスカバリーをめぐる争いは7月に始まり、ニュース組織が当初、AIが自社コンテンツからどのように回答を生成するのかを分析するため、1億2,000万件の会話ログを求めた。

妥協の一環として、OpenAIは保存データのおよそ0.5%に当たる2,000万件のログを提出することに同意した。

しかし、この合意は10月に破綻した。OpenAIが完全な無作為抽出サンプルの提供を拒み、代わりに原告の作品に特に関係する限定的な検索結果のセットを提示したためである。

ワン治安判事は11月に出版社側の主張を認め、12月にはOpenAIの再考申立てを却下した。これを受け、同社は地区裁判官に不服申立てを行った。

不服申立てにおいて、OpenAI は、裁判所がユーザーのプライバシーリスクを十分に考慮しておらず、「最も負担の少ない」ディスカバリー手法を命じるべきだったと主張した。

同社は、盗聴の懸念を理由にSECの通話録音のディスカバリーが阻止された第二巡回区の証券関連の先例を引用した。

スタイン判事は月曜日、これらの主張を退け、現在の事件はその証券の先例とは異なるとした。

同判事は、秘密の盗聴とは異なり、ChatGPTのユーザーは自発的に問い合わせをプラットフォームに送信しており、これらのログの所有権がOpenAIにあることは争いがないと指摘した。

裁判所は、ワン判事が潜在的なプライバシー侵害と、訴訟にとって極めて重要な関連性とのバランスを適切に取っていたと確認し、裁判所が常に最も負担の少ないディスカバリー手段を選ぶべきだとする拘束力のある判例法は存在しないと述べた。

この判断は、多地区訴訟における重要な転機となり、生成AIに知的財産法がどのように適用されるかについての基準を打ち立てる可能性がある。

これらの訴訟の結末は、AI企業がモデル学習のために著作権で保護された素材をどのように取り込み、利用できるかという法的境界を定めることになると見込まれている。

関連記事