マイクロソフト、AI部門トップがウェブ公開コンテンツは「フリーウェア」と語る

Image:NBC News

生成AIが実験の域を脱して巨大ビジネスに成長を遂げるにつれて、その訓練に用いるデータの著作権保護が非常にナーバスな問題となりつつある。米New York TimesがOpenAIとマイクロソフトが巨額の投資にただ乗りしているとして提訴し、トラブルを避けるためにもハイテク大手が報道機関や出版社にライセンス料を支払ったとの報道もあった。

そのさなか、マイクロソフトのコンシューマー向けAI部門トップのムスタファ・スレイマン氏がオープンなウェブ上に何かを公開した瞬間に、誰でも自由にコピーして使える「フリーウェア」になるとの考えを語ったことが注目を集めている。

米CNBCのアンドリュー・ロス・ソーキン氏が「AI企業は世界中のIPをまんまと盗んでいるのではないか」と質問。これに対してスレイマン氏は「すでにオープンなウェブ上にあるコンテンツに関しては、90年代以降、社会的契約はフェアユースとされてきたと思う。誰もがそれをコピーし、再現し、複製できる。それらは“フリーウェア”という理解だ」と答えている。

上記の通り、マイクロソフトとOpenAIは生成AIモデルを訓練するため著作権保護されたネット上のコンテンツを盗用したとして、複数の原告から訴えられている。同社がそうした行為を間違っていないと認識しているのは不思議ではないが、AI部門の責任者がこうした考えを明言することは驚きではある。

まず、米国でも何らかの作品を創作した瞬間に、自動的に著作権で保護されるのは確かだろう。そのために公的機関に届け出る必要もないし、ウェブ上で公開しただけで権利が無効になることもない。逆に著作権を放棄してパブリックドメインにすることは法的に難しく、コピーレフトのような特殊なライセンス形態が編み出されたほどだ。

その一方、フェアユースは「社会契約」により認められるものではなく、著作権侵害で訴えられた側が反論する際に主張し、裁判所が認定して初めて成立する。裁判所が何をコピーするのか、なぜコピーするのか、どの程度コピーするのか、それらが権利者に損害を与えるかどうかを検討したうえで、「公正利用」かどうかをケースバイケースで判断する。要は法廷で被告側が持ち出す防衛手段である。

そのため、多くのAI企業がAI訓練に他人の著作物を使うことは、権利者に受容できないほどの損害を与えない「フェアユース」だと主張してきた。が、スレイマン氏のように公然と語ることは極めて珍しい。

さらにスレイマン氏は、次のようにも述べている。

ウェブサイトや出版社、報道機関が、『他の人がこのコンテンツを見つけられるようにインデックスを作成する以外の理由で、私をスクレイピングしたりクロールすることを禁じる」と明示している場合は、別のカテゴリーとなる。これはグレーゾーンであり、法廷で争うことになると思う

これはおそらく、robot.txtを指しているのだろう。ウェブを巡回して情報を取得するクローラーに対して、クロールしていいページとすべきではないページを指定するテキストファイルだ。もっとも、法的な意味は何もなく、ただクローラーの動作を制御するだけだ。

生成AI企業の数社は、こうしたrobots.txtを無視してスクレイピングしていると報じられていた。その一つがAnthropicであり、もう1つがマイクロソフトのパートナーであるOpenAIである

ちなみにスレイマン氏はDeepMindの共同創業者だが、同じくGoogle傘下のYouTubeはAI訓練の楽曲につき大手音楽レーベルと交渉中との報道があった

© 株式会社 音元出版