June 29, 2024, 12:26 a.m.
4

Amazon enquête apparemment sur Perplexity AI suite à des accusations selon lesquelles il extrait des sites web sans consentement - Engadget

Amazon Web Services mène actuellement une enquête afin de déterminer si Perplexity AI enfreint ses règles, selon Wired. Plus précisément, la division cloud de l'entreprise examine les allégations selon lesquelles Perplexity AI utilise un crawler hébergé sur ses serveurs qui ignore le protocole d'exclusion des robots. Ce protocole, une norme Web, implique que les développeurs placent un fichier robots. txt sur un domaine pour indiquer aux robots s'ils peuvent ou non accéder à une page spécifique. Bien que le respect de ces instructions soit facultatif, les entreprises réputées les ont généralement respectées depuis leur mise en œuvre dans les années 1990. Dans un article précédent, Wired a découvert une machine virtuelle hébergée sur un serveur Amazon Web Services avec l'adresse IP 44. 221. 181. 252, qui contournait les instructions du robots. txt sur son site Web. On dit que cette machine a visité plusieurs propriétés de Condé Nast à plusieurs reprises au cours des trois derniers mois pour récupérer leur contenu. D'autres publications telles que The Guardian, Forbes et The New York Times ont également signalé de multiples visites de la même machine. Wired a effectué une expérience où ils ont inséré des titres ou de brèves descriptions de leurs articles dans le chatbot de Perplexity pour vérifier si l'entreprise récupérait leur contenu.

Les réponses du chatbot ont étroitement paraphrasé les articles "avec un minimum d'attribution". Un rapport récent de Reuters suggère que Perplexity n'est pas la seule entreprise d'IA à contourner les fichiers robots. txt pour collecter du contenu visant à former de grands modèles linguistiques. Cependant, Wired n'a fourni qu'à Amazon des informations concernant le crawler de Perplexity AI. Amazon Web Services a déclaré : "Les conditions de service d'AWS interdisent les activités abusives et illégales, et nos clients sont responsables de leur respect. " Ils ont également mentionné qu'ils reçoivent régulièrement des signalements d'abus présumés et les enquêtent en conséquence. La porte-parole de Perplexity, Sara Platnick, a répondu aux demandes d'Amazon en affirmant que leurs crawlers respectent le protocole d'exclusion des robots et ne violent pas les conditions de service d'AWS. Platnick a également mentionné que l'examen d'Amazon de l'enquête médiatique de Wired suit leur protocole habituel pour enquêter sur les signalements potentiels d'abus de ressources. Cependant, Platnick a admis à Wired que PerplexityBot ignorerait le fichier robots. txt lorsque les utilisateurs incluent une URL spécifique dans leur requête auprès du chatbot. Aravind Srinivas, le PDG de Perplexity, a auparavant nié les accusations selon lesquelles sa société ignorait le protocole d'exclusion des robots et les aurait ensuite niées. Srinivas a admis que Perplexity utilise des crawlers web tiers en plus des siens, le bot identifié par Wired étant l'un d'entre eux. Mise à jour, 28 juin 2024, 14h20 (heure de l'Est) : Cet article a été mis à jour pour inclure la déclaration de Perplexity à Engadget. Mise à jour, 28 juin 2024, 20h27 (heure de l'Est) : Cet article a été mis à jour pour inclure une déclaration d'Amazon Web Services.

News source



Create a post

based on this news in the Content Maker

July 1, 2024, 4:46 a.m.

Le groupe SK vise à sécuriser 56 milliards de dol…

Le groupe SK, le deuxième plus grand conglomérat en Corée du Sud, s'est fixé pour objectif de générer 80 billions de wons (56 milliards de dollars) d'ici 2026

July 1, 2024, 4:30 a.m.

La Meta IA est amusante, accessible et gratuite. …

La semaine dernière, j'ai remarqué une icône d'anneau bleu sur WhatsApp, signalant le déploiement du nouveau chatbot IA de Meta sur différentes applications

July 1, 2024, 1:30 a.m.

Amazon recrute des dirigeants d'Adept pour ses ef…

Selon un récent rapport de Bloomberg News, Amazon aurait recruté des cadres d'Adept AI pour son projet d'intelligence artificielle générale (AGI)

June 30, 2024, 6:42 p.m.

L'intelligence artificielle pourrait-elle sauver …

Le projet No Language Left Behind (NLLB), dirigé par Meta, vise à rendre les publications sur Facebook et Instagram plus accessibles dans 200 langues moins répandues à travers le monde

June 30, 2024, 3:31 p.m.

Les images de l'IA suggèrent une nouvelle ère sur…

L'avènement de la technologie a engendré une vague d'images étranges et irréelles évoquant le surréalisme

June 30, 2024, 1:24 p.m.

SK hynix prévoit un investissement de 74,6 millia…

Le fournisseur de mémoire SK hynix, avec une part de marché de 35% dans le marché des DRAM, a annoncé des plans d'investissement de 74,6 milliards de dollars au cours des trois prochaines années pour renforcer sa position dans le secteur de la mémoire et se concentrer sur les technologies de l'IA

June 30, 2024, 12:01 p.m.

DJ Tests Google's MusicFX and Gemini AI - Video -…

Dans cette vidéo, un DJ de New York nommé Paz teste MusicFX et Gemini AI de Google