Reddit poursuit Anthropic pour avoir prétendument utilisé les données du website pour former des modèles d’IA sans accord de licence approprié, selon un plainte Déposé mercredi devant un tribunal du nord de la Californie. Reddit affirme dans la plainte que l’utilisation non autorisée par Anthropic des données du website à des fins commerciales a été illégale et allègue que la startup de l’IA a violé le contrat d’utilisateur de Reddit.
Le procès de Reddit en fait la première grande entreprise technologique à défier légalement un fournisseur de modèles d’IA sur ses pratiques de données de formation, rejoignant une litanie d’éditeurs qui ont poursuivi des entreprises technologiques sur des raisons similaires.
Le New York Instances a poursuivi Openai et Microsoft pour une formation sur ses articles de presse sans paiement ni autorisation. Pendant ce temps, Sarah Silverman et d’autres auteurs de livres ont Meta poursuivi pour la formation des modèles d’IA sur leurs livres sans approbation. Les éditeurs de musique et les artistes ont également apporté des revendications similaires contre les startups audio, vidéo et génération d’photographs de l’IA, alléguant une mauvaise utilisation de leur contenu.
« Nous ne tolérerons pas les entités à la recherche de revenue comme Anthropic exploitant commercialement le contenu Reddit pour des milliards de {dollars} sans aucun redevannique pour les Redditors ni respect pour leur vie privée », a déclaré Ben Lee, directeur juridique de Reddit, dans un communiqué à TechCrunch.
Notamment, Reddit a signé des accords avec d’autres fournisseurs de modèles d’IA, notamment Openai et Googlequi permettent à ces entreprises de former des modèles d’IA sur les données de Reddit et que les articles du website apparaissent dans les réponses de leurs chatbots d’IA respectives. Cependant, dans le file, Reddit dit qu’il soumet OpenAI et Google à certains termes qui protègent les intérêts et la confidentialité de ses utilisateurs.
Sam Altman, le PDG d’Openai, a un 8,7% de participation dans Redditfaisant de lui le troisième actionnaire, et était autrefois membre du conseil d’administration de la société.
Dans le file, Reddit affirme qu’il a approché anthropic et a précisé que la startup AI n’avait pas l’autorisation de gratter ou d’utiliser le contenu de Reddit. Cependant, Reddit allègue qu’Anthropic «a refusé de s’engager».
Anthropic n’a pas immédiatement fourni de commentaire lorsqu’il est atteint par TechCrunch.
Reddit affirme que dans sa plainte, les robots de gratte d’Anthropic ont ignoré les fichiers robots.txt du réseau social, une norme qui signale aux systèmes automatisés pour ne pas faire de websites Net. Comme preuve supplémentaire qu’Anthropic s’est entraîné sur les données de Reddit, Reddit allègue que le chatbot AI d’Anthropic, Claude, fait souvent référence aux communautés et sujets Reddit sur Reddit.
Reddit demande à Anthropic de payer des dommages-intérêts compensatoires, ainsi qu’une restitution pour le montant par lequel Anthropic a été enrichi par le grattage du contenu de Reddit. Reddit demande également à une injonction interdisant à Anthropic de continuer à utiliser le contenu de Reddit.