Après avoir conclu des accords avec Google et OpenAILe PDG de Reddit, Steve Huffman, appelle Microsoft et d’autres à payer s’ils veulent continuer à extraire les données du web site.
« Sans ces accords, nous n’avons pas notre mot à dire ni notre connaissance de la manière dont nos données sont affichées et de l’utilization qui en est fait, ce qui nous oblige aujourd’hui à bloquer les personnes qui n’ont pas accepté de s’entendre sur la manière dont nous souhaitons que nos données soient utilisées ou non », a déclaré Huffman dans une interview cette semaine. Il a spécifiquement cité Microsoft, Anthropic et Perplexity pour avoir refusé de négocier, affirmant que cela a été « une véritable galère de bloquer ces entreprises ».
Reddit a intensifié sa lutte contre les robots d’indexation ces derniers mois. Début juillet, son fichier robots.txt a été mis à jour pour bloquer les robots d’exploration Internet avec lesquels il n’a pas d’accord. les gens ont commencé à remarquer que les résultats de Reddit n’étaient visibles que dans les résultats de Google — où Reddit est payé pour que ses données soient affichées — et non dans d’autres moteurs de recherche comme Bing.
Huffman a déclaré que Microsoft utilisait les données de Reddit pour entraîner son IA et résumer son contenu dans les résultats de Bing « sans nous le dire », et que les données de Reddit ont également été vendues by way of l’API Bing à d’autres moteurs de recherche. Dans l’interview, il a fait référence au récent commentaire du PDG de Microsoft AI, Mustafa Suleyman, lors d’une conférence selon lequel les données publiques sur Web est un « logiciel gratuit ».
« Microsoft, Anthropic et Perplexity ont agi comme si tout le contenu sur Web était gratuit pour eux », a déclaré Huffman. « C’est leur véritable place. »
En réponse à la disparition récente des résultats de Reddit de Bing, le responsable de la recherche de Microsoft, Jordi Ribas, dit sur X « Reddit a empêché Bing d’explorer son web site pour la recherche, favorisant un autre moteur de recherche et impactant la concurrence de Bing et des moteurs alimentés par Bing. » Caitlin Roulston, porte-parole de Microsoft dit séparément Le bord la semaine dernière que « nous respectons les directions fournies par les websites Internet qui ne souhaitent pas que le contenu de leurs pages soit utilisé avec nos modèles d’IA génératifs ».
« L’échange de valeur traditionnel des moteurs de recherche a changé »
Huffman a souligné l’significance d’OpenAI annonce récente de SearchGPTqui pourra montrer les résultats de Reddit grâce à un accord conclu entre les deux entreprises plus tôt cette année, comme le modèle qu’il souhaite reproduire. Aucun des accords de licence de contenu conclus par Reddit à ce jour n’inclut de cas d’utilisation exclusifs de ses données, selon le porte-parole Tim Rathschmidt.
En appelant à des accords de licence, Reddit est rejoignant des éditeurs de médias plus traditionnels (y compris Le Verge société mère, Vox Media) en quête d’un paiement pour laisser leur contenu alimenter l’IA génératrice. « Je pense que l’échange de valeur traditionnel des moteurs de recherche a changé », a déclaré Huffman. « La recherche, le résumé et la formation fusionnent, et l’échange de valeur de l’exploration en échange du trafic en retour devient confus. »
Les porte-parole de Microsoft, Anthropic et Perplexity n’avaient pas de commentaires sur cet article au second de la publication.