lang icon English
Oct. 23, 2024, 7 a.m.
1219

SynthID de Google DeepMind: Eina de Codi Obert per a Identificació de Text d'IA

Brief news summary

Google DeepMind ha llançat SynthID, una eina de codi obert dissenyada per identificar text generat per IA, com a part d'un conjunt més ampli de solucions de marcatge d'aigua per a IA generativa, que inclou eines per a imatges i vídeos. SynthID està integrat amb l'aplicació de Google Gemini i està disponible a Hugging Face, proporcionant un mitjà per distingir el contingut generat per IA del text escrit per humans, ajudant així en la lluita contra la desinformació. L'eina utilitza un mètode de marcatge d'aigua invisible que ajusta subtilment les probabilitats de tokens durant la generació de text, mantenint la qualitat i creativitat del text produït. La recerca indica que els usuaris sovint tenen dificultats per diferenciar entre text amb o sense una marca d'aigua. No obstant això, l'efectivitat de SynthID pot reduir-se si el text generat és modificat o traduït després. Fent SynthID de codi obert, els desenvolupadors poden adoptar les seves tècniques als seus propis models de IA, promovent pràctiques responsables de IA. Els experts ressalten que mentre el marcatge d'aigua millora la seguretat del contingut, s'hauria d'utilitzar juntament amb la verificació de fets i altres tècniques de verificació per garantir l'exactitud i fiabilitat del material generat per IA.

Google DeepMind ha creat una eina de codi obert dissenyada per identificar text generat per IA, coneguda com SynthID. SynthID forma part d'una gamma més àmplia d'eines de marcatge d'aigua destinades a sortides d'IA generativa. Després de la introducció d'una marca d'aigua per a imatges l'any passat, l'empresa ha publicat posteriorment una per a vídeos generats per IA. Al maig, Google va revelar que SynthID s'està integrant a la seva aplicació Gemini i xatbots en línia i va fer que estigués accessible gratuïtament a Hugging Face, un ben conegut repositori de jocs de dades i models d'IA. Les marques d'aigua s'estan convertint en crucials per ajudar els usuaris a reconèixer continguts generats per IA, cosa essencial per combatre problemes com la desinformació. Pushmeet Kohli, vicepresident de recerca a Google DeepMind, afirma: “Ara, altres desenvolupadors de IA [generativa] poden aprofitar aquesta tecnologia per discernir si les sortides de text provenen dels seus propis [models de llenguatge gran], facilitant així un desenvolupament responsable de IA en tot el tauler. ” SynthID incrusta una marca d'aigua invisible directament al text durant el procés de generació per part d'un model d'IA. Els models de llenguatge gran funcionen descomposant el llenguatge en “tokens” i prediuen el token més probable que segueixi. Aquests tokens poden incloure caràcters individuals, paraules o parts de frases, cadascun assignat amb una puntuació de probabilitat que reflecteix la seva probabilitat de ser la següent paraula en una frase. Probabilitats més grans suggereixen una major probabilitat de selecció pel model. Kohli explica que SynthID introdueix informació addicional a l'estadi de generació ajustant la probabilitat de generació de tokens. Per discernir la marca d'aigua, SynthID examina les puntuacions de probabilitat esperades de les paraules tant en textos marcats com no marcats. Segons Google DeepMind, emprar SynthID no va comprometre la qualitat, precisió, creativitat o velocitat del text generat. Aquesta conclusió va sorgir d'un extens experiment en viu avaluant el rendiment de SynthID després de la seva implementació dins dels productes Gemini, que milions d'usuaris van utilitzar.

Gemini permet als usuaris valorar les respostes del model d'IA utilitzant indicadors de polze amunt o polze avall. Kohli i el seu equip van avaluar dades d'aproximadament 20 milions de respostes de xatbots tant marcats com no marcats, descobrint que no hi havia diferències percebudes en qualitat o utilitat. Les conclusions d'aquest experiment estan detallades en un article publicat a Nature avui. Actualment, SynthID per text és exclusiu per als models de Google, però la intenció darrere de fer-lo de codi obert és ampliar la seva compatibilitat amb més eines. Malgrat els seus avantatges, SynthID té limitacions. La marca d'aigua pot resistir certes tècniques de manipulació, com l'edició lleugera o el retallat, però és menys efectiva quan el text generat per IA es reescriu o es tradueix entre idiomes. També afronta desafiaments quan respon a preguntes factuals, com identificar la capital de França, a causa de les oportunitats limitades per ajustar la probabilitat de les paraules futures sense alterar la informació factual. João Gante, enginyer d'aprenentatge automàtic a Hugging Face, destaca un altre avantatge de fer de codi obert l'eina: permet a qualsevol accedir i integrar lliurement el marcatge d'aigua al seu model. Gante creu que això millorará la privacitat de la marca d'aigua, ja que només el propietari tindrà els secrets criptogràfics. “Amb una accessibilitat i validació millorada de les seves funcionalitats, espero que el marcatge d'aigua es converteixi en una pràctica estàndard, ajudant a la detecció de l'ús maliciós de models de llenguatge, ” diu Gante. No obstant això, Irene Solaiman, cap de política global de Hugging Face, adverteix que les marques d'aigua no són una solució completa. “El marcatge d'aigua representa només un aspecte de models més segurs dins d'un ecosistema que necessita una diversitat de mesures de seguretat complementàries. De la mateixa manera, la verificació de fets per a contingut generat per humans pot tenir nivells variables d'efectivitat, ” explica.


Watch video about

SynthID de Google DeepMind: Eina de Codi Obert per a Identificació de Text d'IA

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 14, 2025, 1:26 p.m.

Anthropic descobreix una campanya de hacking impu…

Anthropic, una empresa líder en intel·ligència artificial, ha revelat un desenvolupament revolucionari i alarmant en ciberseguretat: el primer cas documentat d’una IA que dirigeix de manera autònoma una campanya de hacking.

Nov. 14, 2025, 1:25 p.m.

Vídeos de Sora generats per IA sobre les batudes …

“Tingui cura, senyor, segueixi avançant,” diu un agent de policia amb un chaleco etiquetat ICE i un escut marcat “POICE” a un home de aparença llatina vestit amb un chaleco d’empleat de Walmart.

Nov. 14, 2025, 1:18 p.m.

Kevin Reilly nomenat director general de la consu…

Kevin Reilly, un veterà executiu de Hollywood conegut pel seu paper clau en el llançament de sèries de televisió emblemàtiques com "The Sopranos", "The Office" i "Glee", ha assumit un nou repte com a CEO de Kartel, una consultora creativa d’IA amb seu a Beverly Hills.

Nov. 14, 2025, 1:14 p.m.

Google s'enfronta a una investigació antitrust de…

La Unió Europea ha engegat una investigació antitrust important sobre la política de SPAM de Google arran de les preocupacions de diversos editors de notícies a través d’Europa.

Nov. 14, 2025, 1:12 p.m.

Dealism llança el primer agent de vendes per a in…

SINGAPUR, 13 de novembre de 2025 /PRNewswire/ -- La companyafundada recentment a Singapur, DEALISM PTE.

Nov. 14, 2025, 9:31 a.m.

SEO impulsat per IA: la pròxima frontera del màrq…

La intel·ligència artificial (IA) s'està convertint ràpidament en una força transformadora en el màrqueting digital, especialment en l'optimització per a motors de cerca (SEO).

Nov. 14, 2025, 9:22 a.m.

La intel·ligència artificial és un aliat, no l'en…

En Shelley E. Kohan dóna la benvinguda a Leigh Sevin, cofundadora d’Endear, una solució de CRM dissenyada per a marques de venda al detall modernes i multicanal.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today