米国の新聞社New York Timesが、マイクロソフトとOpenAIに対し著作権侵害の損害賠償を求める訴訟を起こしました。
新聞社は、マイクロソフトとOpenAIが同紙の知的財産権を侵害していると主張し、違法な複製と使用に対し数十億ドルの法定および実際の損害賠償の責任を問うことを求めると訴状に記しています。
NYTは声明で「生成AIなどのツールは、独立ジャーナリズムとコンテンツを使って構築され、使用され続けている。これらのツールは、われわれや他の報道機関が、多額の費用と相当の専門知識を駆使して報道、編集、事実確認を行ったからこそ入手可能だ」と述べ、NYTのドメイン (www.nytimes.com) が GPT-3 をトレーニングするためのデータコンテンツ用にマイニングされたソースとして最も多く使用されていたと強調しました。
さらに、マイクロソフトとOpenAIの大規模言語モデルはNYTの「コンテンツをそのまま復唱し、または忠実に要約し、表現スタイルを模倣した出力を生成できる」とし、NYTに「誤った情報を帰属させ」NYTからコンテンツの購読料、ライセンス料金、広告料、アフィリエイト収入を奪っている」としています。
米国著作権法では、本来は著作権者の許諾が必要な利用であっても、引用や批評、教育目的など一定の条件のもとで許諾なしの利用を例外的に認めるフェアユースの概念がありますが、NYT側はOpenAIの生成AIは学習した記事をそのまま要約したり、スタイルを模倣して文章を出力でき、 (記事を確認せずChatGPT等に質問して事実確認をするユーザーなど、)NYTの本来のオーディエンスを奪う競合関係になることから、フェアユースには当たらないと主張しています。
一方、OpenAIの広報担当者リンジー・ヘルド氏は声明で、OpenAIはNYTとの対話で「建設的に前進」しており、今回の訴訟に対し「驚き、失望している」と述べました。マイクロソフトは記事執筆時点でコメントを出していません。
また、具体的にどれほどの記事が使われているのかという点については、ウェブサイトやその他の関連ブランド全体で公開されたニュース速報記事から論説にいたるまで、6600万件以上の記事が使用され、マイクロソフトとOpenAIが「ほぼ1世紀分に相当する著作権保護コンテンツ」を使用し、NYTの収益に重大な損害を与えたと主張しています。
OpenAIに対しては、複数の報道機関がAIを強化するためのデータに自社のコンテンツを使用されたことについて補償を求める動きを見せているほか、コメディアンのサラ・シルバーマン氏をはじめ、ジョン・グリシャム氏やジョージ・R・R・マーティン氏、ピューリッツァー賞受賞作家テイラー・ブランチ氏な著名な作家たちもいくつかのグループで著作権侵害訴訟を起こしています。
NYTという大きな山が動いたことで、この訴訟の進展具合によっては、OpenAIに記事を使用されたと考える他のニュース各社、たとえばReutersやCNN、BBC Newsなども同様の訴訟に踏み切る可能性が考えられます。
今回の訴訟が損害賠償だけで解決するのか、将来的に大規模言語モデルの強化用コンテンツ提供の契約にまで至るのかはまだわかりません。ただ、OpenAIもまったくニュースソースにコンテンツ使用料を支払わないという姿勢ではないようで、最近ではドイツの大手メディア企業Axel Springerとの間でコンテンツの使用に関する数百万ドル相当といわれる契約を結んでいます。またBusiness InsiderおよびPoriticoは今月、OpenAIの次世代AIツールの強化用に記事を使用する3年間の契約に合意したと伝えられています。
OpenAIは大規模言語モデルGPTと、これを利用するAIチャットボットChatGPTの開発元です。現在のGPT-3.5およびGPT-4は、2021年9月までにインターネット上に公開されていたデータから取得された数十億パラメータ分のデータによって実現されています。