Un estudi recent revela grans diferències en com els llocs web de notícies de renom i els llocs de desinformació gestionen l’accés dels rastrejadors d’AI mitjançant els arxius robots. txt, un protocol web que controla els permisos dels rastrejadors. En analitzar un conjunt de dades de tots dos tipus de llocs, els investigadors han trobat que el 60 % dels mitjans de notícies de renom bloquegen almenys un rastrejador d’AI, mentre que només el 9, 1 % dels llocs de desinformació imposen aquestes restriccions. En mitjana, els llocs de renom només permeten uns 15, 5 agents d’usuari d’AI, indicating un esforç ampli i deliberat per limitar la raspadant automatitzada, mentre que els llocs de desinformació sovint restrinjeixen menys d’un rastrejador d’AI. L’estudi també va examinar les mesures de bloqueig actiu — defenses en temps real contra els rastrejadors d’AI — i va trobar que, tot i que ambdues tipologies de llocs implementen aquestes pràctiques, els mitjans de comunicació de renom les apliquen de manera més consistent en el compliment de les seves polítiques dels arxius robots. txt. Aquestes diferències de enfocament afecten la disponibilitat de contingut en línia per a l’entrenament dels models d’AI. Com que l’AI depèn en gran mesura de les dades web, les restriccions més estrictes dels recursos de renom poden limitar l’accés a dades de qualitat, mentre que els llocs de desinformació més oberts arrisquen a distorsionar l’entrenament de l’AI cap a contingut no fiable. Aquesta desigualtat planteja qüestions importants ètiques i de transparència, ja que els models d’AI podrien aprendre de manera desproporcionada de la informació enganyosa, afectant-ne la fiabilitat i la justícia. Els resultats destaquen la responsabilitat dels proveïdors de contingut, especialment els mitjans consolidats, d’administrar l’accés dels rastrejadors per protegir la seva propietat intel·lectual i controlar-ne la distribució.
D’altra banda, els desenvolupadors d’AI han de prendre en consideració aquestes limitacions d’accés per entendre millor els possibles biaixos i les mancances dels seus models. A mesura que la integració de l’AI s’intensifica a la societat, la transparència pel que fa a l’origen de les dades d’entrenament i l’ètica guanya força. L’estudi posa de manifest la creixent discrepància entre les pràctiques dels llocs web de renom i els de desinformació, subratllant la necessitat de continuar amb la recerca i el diàleg polític sobre l’accés al contingut i el desenvolupament responsable de l’AI. Serà crucial que creadors de contingut, investigadors d’AI, responsables polítics i el públic col·laborin per idear solucions equilibrades que respectin els drets del contingut i promoguin una AI precisa i ètica. Entre les possibles mesures hi ha la creació de directrius estàndard per als arxius robots. txt per als rastrejadors d’AI, una major transparència en les dades d’entrenament d’AI i la sensibilització pública sobre els influences en el contingut generat per AI. En resum, l’estudi ofereix proves importants d’una creixent asimetria en la regulació dels rastrejadors d’AI: els mitjans de renom restringeixen activament l’accés, mentre que els llocs de desinformació es mantenen en la majoria dels casos permissius. Aquesta dinàmica modela els conjunts de dades per a l’entrenament de l’AI i, en conseqüència, la qualitat i els biaixos dels resultats que aquesta genera. Approximacions reflexives i cooperatives són essencials per garantir que l’AI beneficiï la societat de manera segura i equitativa.
Estudi revela diferències en l'accés dels rastrejadors d'IA entre llocs de notícies de bona reputació i plataformes de desinformació
Assignar un valor en dòlars precís als reptes que afronten els equips creatius assistits per IA és difícil, però cadascun d’ells representa un obstacle potencial que amenaça el seu èxit.
Sortiments de Bones Festes! En aquesta primera edició de Les Lectures de la Temporada, revisem els desenvolupaments claus de 2025 en ciberseguretat i intel·ligència artificial (IA), que van continuar sent les principals prioritats de la SEC malgrat un canvi de lideratge i estratègies canviants.
El panorama de l'optimització per a motors de cerca (SEO) està passant per una gran transformació amb l'aparició de xatbots d'intel·ligència artificial conversacional com Bing Copilot, ChatGPT Plus, Perplexity i l'Experiència Generativa de Cerca de Google (SGE).
Fins al 2028, Gartner, Inc.
La transició ràpida cap al teletreball en els últims anys ha canviat profundament la manera com les empreses funcionen i es comuniquen.
Vista Social, una plataforma líder en màrqueting en xarxes socials, ha llançat una funció innovadora: el generador de text a imatge AI de Canva.
Durants dels últims 18 mesos, l’equip SaaStr s’ha submergit en l’àmbit de la Intel·ligència Artificial i les vendes, amb una acceleració important a partir de juny de 2025.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today