June 28, 2024, 4:26 p.m.

None

Brief news summary

Amazon Web Services (AWS) mène une enquête sur Perplexity AI pour une éventuelle violation de ses règles, selon Wired. La division cloud d'AWS examine les allégations selon lesquelles le crawler de Perplexity AI, hébergé sur des serveurs AWS, ne respecte pas le protocole d'exclusion des robots. Ce protocole permet aux développeurs de spécifier si les robots peuvent accéder à certaines pages Web. Wired a précédemment rapporté qu'une machine virtuelle hébergée sur des serveurs AWS avait visité divers sites Web d'éditeurs, contournant leurs instructions robots.txt. Pour confirmer cela, Wired a saisi des titres d'articles dans le chatbot de Perplexity AI et a reçu des résultats paraphrasés de près. D'autres entreprises d'intelligence artificielle pourraient également contourner les fichiers robots.txt pour collecter du contenu. AWS a déclaré que les clients sont responsables de se conformer à ses conditions d'utilisation et qu'elle enquête sur les signalements d'abus. Perplexity a nié avoir violé le protocole d'exclusion des robots, mais a admis que son chatbot ignorait les fichiers robots.txt lorsqu'on lui donnait des URL spécifiques.

Amazon Web Services mène actuellement une enquête afin de déterminer si Perplexity AI enfreint ses règles, selon Wired. Plus précisément, la division cloud de l'entreprise examine les allégations selon lesquelles Perplexity AI utilise un crawler hébergé sur ses serveurs qui ignore le protocole d'exclusion des robots. Ce protocole, une norme Web, implique que les développeurs placent un fichier robots. txt sur un domaine pour indiquer aux robots s'ils peuvent ou non accéder à une page spécifique. Bien que le respect de ces instructions soit facultatif, les entreprises réputées les ont généralement respectées depuis leur mise en œuvre dans les années 1990. Dans un article précédent, Wired a découvert une machine virtuelle hébergée sur un serveur Amazon Web Services avec l'adresse IP 44. 221. 181. 252, qui contournait les instructions du robots. txt sur son site Web. On dit que cette machine a visité plusieurs propriétés de Condé Nast à plusieurs reprises au cours des trois derniers mois pour récupérer leur contenu. D'autres publications telles que The Guardian, Forbes et The New York Times ont également signalé de multiples visites de la même machine. Wired a effectué une expérience où ils ont inséré des titres ou de brèves descriptions de leurs articles dans le chatbot de Perplexity pour vérifier si l'entreprise récupérait leur contenu.

Les réponses du chatbot ont étroitement paraphrasé les articles "avec un minimum d'attribution". Un rapport récent de Reuters suggère que Perplexity n'est pas la seule entreprise d'IA à contourner les fichiers robots. txt pour collecter du contenu visant à former de grands modèles linguistiques. Cependant, Wired n'a fourni qu'à Amazon des informations concernant le crawler de Perplexity AI. Amazon Web Services a déclaré : "Les conditions de service d'AWS interdisent les activités abusives et illégales, et nos clients sont responsables de leur respect. " Ils ont également mentionné qu'ils reçoivent régulièrement des signalements d'abus présumés et les enquêtent en conséquence. La porte-parole de Perplexity, Sara Platnick, a répondu aux demandes d'Amazon en affirmant que leurs crawlers respectent le protocole d'exclusion des robots et ne violent pas les conditions de service d'AWS. Platnick a également mentionné que l'examen d'Amazon de l'enquête médiatique de Wired suit leur protocole habituel pour enquêter sur les signalements potentiels d'abus de ressources. Cependant, Platnick a admis à Wired que PerplexityBot ignorerait le fichier robots. txt lorsque les utilisateurs incluent une URL spécifique dans leur requête auprès du chatbot. Aravind Srinivas, le PDG de Perplexity, a auparavant nié les accusations selon lesquelles sa société ignorait le protocole d'exclusion des robots et les aurait ensuite niées. Srinivas a admis que Perplexity utilise des crawlers web tiers en plus des siens, le bot identifié par Wired étant l'un d'entre eux. Mise à jour, 28 juin 2024, 14h20 (heure de l'Est) : Cet article a été mis à jour pour inclure la déclaration de Perplexity à Engadget. Mise à jour, 28 juin 2024, 20h27 (heure de l'Est) : Cet article a été mis à jour pour inclure une déclaration d'Amazon Web Services.

News source

Watch video about

None

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

None

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Hot news

L'accélérateur d'IA d'Intel : amplifier les perfo…

Progrès dans la détection des deepfakes grâce à l…

13 marques utilisant l'IA pour le marketing sur l…

6 agences attirant des investissements en capital…

Le PDG de Caylent sur le rôle principal d'AWS dan…

Les outils d'automatisation des médias sociaux al…

Candid lance Live Marketing : « L'IA accomplira 9…

AI Company

Sales

Marketing

None

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Hot news

L'accélérateur d'IA d'Intel : amplifier les perfo…

Progrès dans la détection des deepfakes grâce à l…

13 marques utilisant l'IA pour le marketing sur l…

6 agences attirant des investissements en capital…

Le PDG de Caylent sur le rôle principal d'AWS dan…

Les outils d'automatisation des médias sociaux al…

Candid lance Live Marketing : « L'IA accomplira 9…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?