OpenAIともども、どうなっていくのか。
Googleが案の定というか、集団訴訟を起こされました。きっかけは先日、Googleが「ネット上にあるものはすべてAIの訓練素材にする」という主旨でプライバシーポリシーを改定したことです。原告の主張は、著作権保護下の作品や無数の人の個人データなど、ネット上に共有されたものすべてをGoogleが「盗んだ」というものです。
「Googleは、インターネットも、我々の創作物も、我々の人としての表現も、家族や子供の写真もすべて、『オンラインにあるから』という理由だけで所有することはできません」集団訴訟を取りまとめているClarkson法律事務所のマネージング・パートナー、Ryan Clarkson氏は言います。「我々は、Googleが無数のインターネットユーザーのオンライン上の創作物または共有したものすべてを取得し、それを商用AI製品の訓練・構築に利用していることを最近知りました。そのデータの中には我々の個人情報や創作作品、仕事上の成果物などが含まれています。」
ChatGPTの開発元・OpenAIも、ほぼ同じような理由で訴えられたばかりです。ちなみにそちらの集団訴訟をまとめているのも、同じ法律事務所です。ChatGPTやGoogleのBardだけでなく、その他もろもろのAIも、インターネットから収集した膨大な公開情報を使って学習しています。
人間には合法でも、AIがやると違法?
生成AIは何らかの大量のデータを受け取って学習し、それに基づいて何らかの「新しい」コンテンツを作り出します。その仕組みは、司法に新たな問いを投げかけました。つまり、人間が他人の作品から新たなコンテンツの着想を得る場合、それはまったく合法です。じゃあ、私企業の開発するAIが他人のデータを元にコンテンツを生み出す場合、それも合法と言えるんでしょうか?
今のところその答えには議論の余地がありますが、Googleを訴えた人たちは、Googleは著作権法に違反しているし、個人情報も合意なく収集していると言っています。原告には、訴状だとイニシャルしかありませんが、ニューヨーク・タイムズのベストセラー作家や、6歳の男児、ソフトウェアデベロッパー、TikTokインフルエンサー、俳優などさまざまな人が含まれています。
Googleの反論
「我々は長年、公共の情報源から得たデータ、たとえばオープンなWebに公開された情報や、公開のデータセットを、Google翻訳のようなサービスの裏側にあるAIモデルの学習に使うと明言してきました。それは責任を持って、我々のAI原則にのっとって行います」Googleの顧問弁護士、Halimah DeLaine Pradoは今回の訴えにこう反論しています。「米国の法律は、公開情報を使って新たな便益を創造することをサポートしてきました。我々はこうした根拠のない主張には反論していきたいです。」
たしかに、GoogleのAIがデータを収集していることはずっと秘密じゃありませんでした。Googleのプライバシーポリシーには以前から、公に利用可能な情報を使って、Google翻訳のような「言語モデル」の学習に役立てると明記されてました。でもほとんどの人はプライバシーポリシーを熟読しないし、読んだとしても「言語モデル」が何なのか、AI的な何かなのかどうかもわからないのが普通です。ただ7月1日、Googleはプライバシーポリシーを以下のように改定し、例示する言語モデルを追加しました。
Googleは、サービスを改善し、我々のユーザーや一般社会に役立つような新製品や機能、技術を開発するために情報を利用します。私たちはたとえば公に入手可能な情報を使い、GoogleのAIモデルの訓練や、Google翻訳、Bard、Cloud AIの機能といった製品や機能の構築に役立てます。
国内最大級の品揃え【DMMブックス】ロリポップ!
どんなソフトを使ったら良いか分からないアナタに!ソフトナビ
AI利用凍結や「データの配当」を要求
でも今回の訴状では、Googleがデータをこっそり収集したのだと主張されています。「Googleは長年このデータを秘密裏に収集しており、誰かに注意を与えることも、まして合意を取ることもありませんでした」Clarkson氏は言います。
この訴訟の原告は、Googleが少なくとも50億ドル(約7000億円)を支払う義務がありうるとし、何らかの保護対策ができるまではGoogleのAI技術の商業利用を凍結すること、GoogleのAI開発に自身の情報が利用された人に「データの配当」を支払うことを要求しています。
この訴訟は基本的にOpenAIに対するものと同じですが、Googleの場合ちょっと違うのは、Google検索というもはや社会インフラなサービスを運営していることです。そしてGoogleは、検索サービスの基礎として長年Webデータを収集してきたし、「AI」といちいちアピールしなくても、機械学習やニューラルネットワークといったAIの技術をいろんな形で使ってきました。今後もしAIの学習用データの収集に制限が必要という声が高まってきたら、今まで知らずしらず行われてきたこと、みんながその恩恵を受けていることとの折り合いをどう付けるのかという課題も出てきそうです。
情報元
https://www.gizmodo.jp/2023/07/google-bard-ai-stole-data-class-action.html