lang icon En
June 28, 2024, 4:26 p.m.
1806

None

Brief news summary

Amazon Web Services (AWS) mène une enquête sur Perplexity AI pour une éventuelle violation de ses règles, selon Wired. La division cloud d'AWS examine les allégations selon lesquelles le crawler de Perplexity AI, hébergé sur des serveurs AWS, ne respecte pas le protocole d'exclusion des robots. Ce protocole permet aux développeurs de spécifier si les robots peuvent accéder à certaines pages Web. Wired a précédemment rapporté qu'une machine virtuelle hébergée sur des serveurs AWS avait visité divers sites Web d'éditeurs, contournant leurs instructions robots.txt. Pour confirmer cela, Wired a saisi des titres d'articles dans le chatbot de Perplexity AI et a reçu des résultats paraphrasés de près. D'autres entreprises d'intelligence artificielle pourraient également contourner les fichiers robots.txt pour collecter du contenu. AWS a déclaré que les clients sont responsables de se conformer à ses conditions d'utilisation et qu'elle enquête sur les signalements d'abus. Perplexity a nié avoir violé le protocole d'exclusion des robots, mais a admis que son chatbot ignorait les fichiers robots.txt lorsqu'on lui donnait des URL spécifiques.

Amazon Web Services mène actuellement une enquête afin de déterminer si Perplexity AI enfreint ses règles, selon Wired. Plus précisément, la division cloud de l'entreprise examine les allégations selon lesquelles Perplexity AI utilise un crawler hébergé sur ses serveurs qui ignore le protocole d'exclusion des robots. Ce protocole, une norme Web, implique que les développeurs placent un fichier robots. txt sur un domaine pour indiquer aux robots s'ils peuvent ou non accéder à une page spécifique. Bien que le respect de ces instructions soit facultatif, les entreprises réputées les ont généralement respectées depuis leur mise en œuvre dans les années 1990. Dans un article précédent, Wired a découvert une machine virtuelle hébergée sur un serveur Amazon Web Services avec l'adresse IP 44. 221. 181. 252, qui contournait les instructions du robots. txt sur son site Web. On dit que cette machine a visité plusieurs propriétés de Condé Nast à plusieurs reprises au cours des trois derniers mois pour récupérer leur contenu. D'autres publications telles que The Guardian, Forbes et The New York Times ont également signalé de multiples visites de la même machine. Wired a effectué une expérience où ils ont inséré des titres ou de brèves descriptions de leurs articles dans le chatbot de Perplexity pour vérifier si l'entreprise récupérait leur contenu.

Les réponses du chatbot ont étroitement paraphrasé les articles "avec un minimum d'attribution". Un rapport récent de Reuters suggère que Perplexity n'est pas la seule entreprise d'IA à contourner les fichiers robots. txt pour collecter du contenu visant à former de grands modèles linguistiques. Cependant, Wired n'a fourni qu'à Amazon des informations concernant le crawler de Perplexity AI. Amazon Web Services a déclaré : "Les conditions de service d'AWS interdisent les activités abusives et illégales, et nos clients sont responsables de leur respect. " Ils ont également mentionné qu'ils reçoivent régulièrement des signalements d'abus présumés et les enquêtent en conséquence. La porte-parole de Perplexity, Sara Platnick, a répondu aux demandes d'Amazon en affirmant que leurs crawlers respectent le protocole d'exclusion des robots et ne violent pas les conditions de service d'AWS. Platnick a également mentionné que l'examen d'Amazon de l'enquête médiatique de Wired suit leur protocole habituel pour enquêter sur les signalements potentiels d'abus de ressources. Cependant, Platnick a admis à Wired que PerplexityBot ignorerait le fichier robots. txt lorsque les utilisateurs incluent une URL spécifique dans leur requête auprès du chatbot. Aravind Srinivas, le PDG de Perplexity, a auparavant nié les accusations selon lesquelles sa société ignorait le protocole d'exclusion des robots et les aurait ensuite niées. Srinivas a admis que Perplexity utilise des crawlers web tiers en plus des siens, le bot identifié par Wired étant l'un d'entre eux. Mise à jour, 28 juin 2024, 14h20 (heure de l'Est) : Cet article a été mis à jour pour inclure la déclaration de Perplexity à Engadget. Mise à jour, 28 juin 2024, 20h27 (heure de l'Est) : Cet article a été mis à jour pour inclure une déclaration d'Amazon Web Services.


Watch video about

None

Try our premium solution and start getting clients — at no cost to you

Content creator image

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

March 17, 2026, 2:23 p.m.

L'accélérateur d'IA d'Intel : amplifier les perfo…

Intel a présenté une nouvelle puce accélératrice d'IA conçue pour améliorer considérablement la performance de l'apprentissage automatique sur une gamme variée de plateformes.

March 17, 2026, 2:19 p.m.

Progrès dans la détection des deepfakes grâce à l…

Les chercheurs ont fait des progrès significatifs dans la lutte contre la désinformation en développant des algorithmes d'intelligence artificielle avancés capables de détecter les vidéos deepfake, des contenus vidéo extrêmement réalistes mais fabriqués à l'aide de l'intelligence artificielle et de l'apprentissage automatique.

March 17, 2026, 2:16 p.m.

13 marques utilisant l'IA pour le marketing sur l…

Si vous êtes un marketeur, créateur ou propriétaire de marque ne exploitant pas l'IA pour les réseaux sociaux, vous êtes en train de prendre du retard sur vos concurrents.

March 17, 2026, 2:15 p.m.

6 agences attirant des investissements en capital…

Les investisseurs en capital-investissement se préparent à acquérir davantage d'agences indépendantes.

March 17, 2026, 2:12 p.m.

Le PDG de Caylent sur le rôle principal d'AWS dan…

Valérie Henderson,PDG de Caylent, une société basée à Irvine, en Californie, partenaire Premier d'AWS avec environ 950 employés à l’échelle mondiale, met en lumière un changement dans le modèle économique du secteur des services — passant d’une croissance par augmentation des effectifs en fonction du chiffre d'affaires à une croissance centrée sur les résultats et la valeur.

March 17, 2026, 10:38 a.m.

Les outils d'automatisation des médias sociaux al…

Postmypost a lancé un assistant révolutionnaire alimenté par l'IA, destiné à transformer la gestion des réseaux sociaux pour les marques et les entreprises.

March 17, 2026, 10:35 a.m.

Candid lance Live Marketing : « L'IA accomplira 9…

AMSTERDAM, le 17 mars 2026 /PRNewswire/ -- Candid Platform dévoile aujourd'hui Live Marketing, un environnement d'IA complet conçu spécifiquement pour le marketing.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

AI Company welcome image

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today