Amazon Internet Companies a lancé une enquête pour déterminer si Perplexity AI enfreint ses règles, selon Câblé. Pour être précis, la division cloud de l’entreprise enquêterait sur des allégations selon lesquelles le service utiliserait un robotic d’exploration, hébergé sur ses serveurs, qui ignorerait le protocole d’exclusion des robots. Ce protocole est une norme Internet, dans laquelle les développeurs placent un fichier robots.txt sur un domaine contenant des directions sur la possibilité ou non pour les robots d’accéder à une web page particulière. Le respect de ces directions est volontaire, mais les robots d’exploration des entreprises réputées les respectent généralement depuis que les développeurs Internet ont commencé à mettre en œuvre la norme dans les années 90.
Dans un article précédent, Filaire signalé qu’il a découvert une machine virtuelle qui contournait les directions robots.txt de son website Internet. Cette machine était hébergée sur un serveur Amazon Internet Companies utilisant l’adresse IP 44.221.181.252 qui est « certainement exploitée par Perplexity ». Il aurait également visité d’autres propriétés de Condé Nast des centaines de fois au cours des trois derniers mois pour en extraire le contenu. Le Gardien, Forbes et Le New York Instances je l’avais également détecté en visitant leurs publications à plusieurs reprises, Câblé a déclaré. Pour confirmer si Perplexity supprimait vraiment son contenu, Filaire Les utilisateurs ont saisi des titres ou de courtes descriptions de leurs articles dans le chatbot de l’entreprise. L’outil a ensuite répondu avec des résultats qui paraphrasaient fidèlement ses articles « avec un minimal d’attribution ».
Une récente Reuters le rapport a affirmé que Perplexity n’est pas la seule entreprise d’IA cela contourne les fichiers robots.txt pour rassembler le contenu utilisé pour former de grands modèles de langage. Cependant, il semble que Câblé Amazon n’a fourni à Amazon que des informations sur le robotic d’exploration de Perplexity AI. « Les situations de service d’AWS interdisent les activités abusives et illégales et nos shoppers sont responsables du respect de ces situations », nous a déclaré Amazon Internet Companies dans un communiqué. « Nous recevons régulièrement des rapports d’abus présumés de diverses sources et nous encourageons nos shoppers à comprendre ces rapports. » Le porte-parole a également ajouté que la division cloud de l’entreprise avait déclaré Filaire il enquêtait sur les informations fournies par la publication, comme il le fait pour tous les rapports faisant état de violations potentielles.
La porte-parole de Perplexité, Sara Platnick, a déclaré Filaire que la société a déjà répondu aux demandes d’Amazon et a nié que ses robots contournent le protocole d’exclusion des robots. « Notre PerplexityBot – qui fonctionne sur AWS – respecte le fichier robots.txt, et nous avons confirmé que les companies contrôlés par Perplexity n’explorent pas d’une manière qui viole les situations de service d’AWS », a-t-elle déclaré. Platnick nous a dit qu’Amazon avait étudié Filaire L’enquête médiatique ne s’inscrit que dans le cadre d’un protocole customary d’enquête sur les signalements d’abus de ses ressources. L’entreprise n’a apparemment jamais entendu parler d’Amazon à propos d’un quelconque sort d’enquête auparavant. Câblé contacté l’entreprise. Platnick a admis avoir Filairecependant, PerplexityBot ignorera robots.textual content lorsqu’un utilisateur inclut une URL spécifique dans sa demande de chatbot.
Aravind Srinivas, PDG de Perplexity, a également nié précédemment que son entreprise « ignore le protocole d’exclusion des robots et ment ensuite à ce sujet ». Srinivas a admis Entreprise rapide que Perplexity utilise des robots d’exploration Internet tiers en plus du sien, et que le bot Câblé identifié était l’un d’entre eux.
Mise à jour, 28 juin 2024, 14 h 20 HE : Nous avons mis à jour cet article pour ajouter la déclaration de Perplexity à Engadget.
Mise à jour, 28 juin 2024, 20 h 27 HE : Nous avons mis à jour cet article avec une déclaration d’Amazon Internet Companies.