Contents

Reddit、AI をトレーニングするためにユーザーデータをスクレイピングした Perplexity を訴訟

Contents

<本文>/images/Reddit-faces-FTC-inquiry-over-the-sale-of-user-data-to-AI-companies.jpg

データのさらなる使用を阻止する命令とともに金銭的損害賠償を求める

人工知能がテクノロジー業界の注目の的になって以来、ニュース出版社からクリエイティブ専門家に至るまで、テクノロジー大手企業が複数の訴訟に直面している。誰もが自分のコンテンツがどのように使用されているかを知りたいと思っています。

さて、Redditが再び法廷に入り、今度は検索エンジンを訓練するためにユーザーが生成したデータを許可なくスクレイピングした疑いでPerplexity AIを訴えた。

ニューヨーク連邦裁判所に起こされたこの訴訟は、Perplexityが、Oxylabs(リトアニア)、AWMProxy(ロシア)、SerpApi(テキサス)のデータ会社3社とともに、Redditの保護を回避して、いわゆる「回答エンジン」を動かすデータを収集したと主張している。

Redditは、PerplexityはAIモデルの精度を高めるために人間が書いたコンテンツを「切実に必要としている」と主張している。だからこそ、Reddit に優位性を与えるために、Reddit の膨大なディスカッション ライブラリをスクレイピングしているのです。 Redditは現在、金銭的損害賠償と、データのさらなる使用を阻止する裁判所命令を求めている。

同社によれば、これは1件だけではないとのこと。 Redditは6月、同様の主張を理由に別のAIスタートアップであるAnthropicを訴訟した。レディットの最高法務責任者ベン・リー氏は、この問題を「データロンダリング経済」の一環と表現し、AI企業は「質の高い人間コンテンツをめぐる軍拡競争に巻き込まれている」と述べた。

しかし、パープレクシティ氏は不正行為を否定している。同社は声明で「正確なAIで事実に基づく回答を提供するという当社のアプローチは原則的かつ責任あるものであり、公開性や公共の利益に対する脅威を容認しない」と述べ、法廷で自らを弁護する意向を付け加えた。

*️⃣ 出典リンク:

ニュース出版社より、 ユーザー生成データをスクレイピングした疑いで Perplexity AI を訴える訴訟