Google DeepMinds SynthID: Open-Source AI Tekst Identifikationsværktøj

Google DeepMind har skabt et open-source værktøj designet til at identificere AI-genereret tekst, kendt som SynthID. SynthID er en del af en bredere række af værktøjer til vandmærkning rettet mod generative AI-udgange. Efter introduktionen af et vandmærke til billeder sidste år, har virksomheden efterfølgende frigivet et til AI-genereret video. I maj afslørede Google, at SynthID bliver integreret i sin Gemini-app og online chatbots og gjorde det tilgængeligt gratis på Hugging Face, et velkendt AI-datasaamlinger og modeller depot. Vandmærker bliver afgørende for at hjælpe brugere med at genkende AI-genereret indhold, hvilket er væsentligt for at bekæmpe problemer såsom misinformation. Pushmeet Kohli, vicepræsident for forskning hos Google DeepMind, udtaler, “Nu kan andre [generative] AI-udviklere udnytte denne teknologi til at afgøre, om tekstudgange stammer fra deres egne [store sprogmodeller], således lettes ansvarlig AI-udvikling på tværs af alle områder. ” SynthID indlejrer et usynligt vandmærke direkte i teksten under genereringsprocessen af en AI-model. Store sprogmodeller fungerer ved at dekomponere sprog i “tokens” og forudsige det mest sandsynlige token at følge. Disse tokens kan omfatte enkelttegn, ord eller dele af sætninger, hver tildelt en sandsynlighedsscore, der afspejler dens sandsynlighed for at blive det næste ord i en sætning. Større sandsynligheder antyder øget sandsynlighed for udvalg af modellen. Kohli forklarer, at SynthID introducerer ekstra information på genereringsstadiet ved at justere sandsynligheden for tokengenerering. For at skelne vandmærket undersøger SynthID de forventede sandsynlighedsscorer for ord i både vandmærkede og ikke-vandmærkede tekster. Ifølge Google DeepMind kompromitterede brugen af SynthID ikke kvaliteten, nøjagtigheden, kreativiteten eller hastigheden af den genererede tekst. Denne konklusion stammede fra et omfattende live-eksperiment, der vurderede SynthID's ydeevne efter vandmærkning inden for Gemini-produkter, som millioner af brugere anvendte.
Gemini gør det muligt for brugere at vurdere AI-modellens svar ved hjælp af tommelfinger-op eller tommelfinger-ned indikatorer. Kohli og hans team evaluerede data fra cirka 20 millioner svar fra både vandmærkede og ikke-vandmærkede chatbots, og fandt ingen opfattede forskelle i kvalitet eller anvendelighed. Fundene fra dette eksperiment er detaljeret i en artikel offentliggjort i Nature i dag. I øjeblikket er SynthID for tekst eksklusivt for Googles modeller, men hensigten bag open-sourcing er at brede dens kompatibilitet med flere værktøjer. På trods af dens fordele har SynthID begrænsninger. Vandmærket kan modstå visse manipuleringsteknikker, såsom let redigering eller beskæring, men er mindre effektivt, når AI-genereret tekst bliver omskrevet eller oversat på tværs af sprog. Det står også over for udfordringer, når der svares på faktuelle forespørgsler, såsom at identificere hovedstaden i Frankrig, på grund af begrænsede muligheder for at justere sandsynligheden for kommende ord uden at ændre faktuelle oplysninger. João Gante, maskinlæringsingeniør hos Hugging Face, fremhæver en anden fordel ved at gøre værktøjet open source: det giver alle mulighed for frit at få adgang til og integrere vandmærkning i deres model. Gante mener, at dette vil forbedre vandmærkets privatliv, da kun ejeren vil besidde dets kryptografiske hemmeligheder. “Med forbedret tilgængelighed og validering af dens funktionaliteter, håber jeg, at vandmærkning vil blive standard praksis og hjælpe med at opdage skadeligt brug af sprogmodeller, ” siger Gante. Dog advarer Irene Solaiman, Hugging Face's chef for global politik, om at vandmærker ikke er en fuldstændig løsning. “Vandmærkning repræsenterer kun en aspekt af sikrere modeller i et økosystem der har brug for en mangfoldighed af komplementerende sikringstiltag. Ligeledes kan faktatjek af menneskeskabt indhold have varierende niveauer af effektivitet, ” forklarer hun.
Brief news summary
Google DeepMind har lanceret SynthID, et open-source værktøj designet til at identificere AI-genereret tekst, som en del af en bredere suite af vandmærkningsløsninger for generativ AI, der inkluderer værktøjer til billeder og videoer. SynthID er integreret med Googles Gemini-applikation og er tilgængelig på Hugging Face, og tilbyder en måde at skelne AI-genereret indhold fra menneskeskrevne tekster på, hvilket hjælper i kampen mod misinformation. Værktøjet anvender en usynlig vandmærkningsmetode, der subtilt justerer token-sandsynligheder under tekstgenerering, mens det opretholder kvaliteten og kreativiteten af den producerede tekst. Forskning viser, at brugere ofte har svært ved at skelne mellem tekst med og uden vandmærke. Men SynthID's effektivitet kan blive reduceret, hvis den genererede tekst efterfølgende ændres eller oversættes. Ved at gøre SynthID open source, kan udviklere anvende dens teknikker i deres egne AI-modeller og fremme ansvarlig AI-praksis. Eksperter understreger, at mens vandmærkning forbedrer indholdets sikkerhed, bør det anvendes sammen med faktatjekning og andre verificeringsteknikker for at sikre nøjagtigheden og pålideligheden af AI-genereret materiale.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Amazon-CEO advarer om AI-drevne jobreduceringer i…
Amazon CEO Andy Jassy har udsendt en væsentlig advarsel om virksomhedens fremtidige arbejdsstyrkestrategi midt i den stigende integration af kunstig intelligens (AI) på tværs af driften.

Bitcoin-pengetankevirksomheder er en revisionsver…
Bitcoin treasury-virksomheders revisionspraksis er for nylig blevet underlagt intensiv gransking, hvilket har afsløret store udfordringer med gennemsigtighed og verifikation inden for denne voksende sektor.

Justin Suns Tron skal børsnoteres gennem omvendt …
Justin Sun, grundlæggeren af det 26 milliarder dollar store Trons blockchain-økosystem, annoncerede planer om at gøre Tron børsnoteret gennem en reverse fusion med Nasdaq-noterede SRM Entertainment, hvilket markerer et afgørende skridt i Trons vækst og synlighed i finans- og teknologisektorerne.

Top Trump-arbejdsminister: Amerikas arbejdere har…
Keith Sonderling, tidligere vice arbejdsminister under Trump-administrationen, har for nylig fremhævet en større hindring for AI-tiltag i den amerikanske arbejdsstyrke: medarbejdernes mistillid.

Avail går fuldt ud som full stack for at erobre d…
17.

Microsoft og OpenAI indgår i komplekse forhandlin…
Microsoft og OpenAI er i øjeblikket involveret i en kompleks og anspændt forhandlingsproces, der kan ændre deres strategiske partnerskab væsentligt og påvirke den brede kunstig intelligens-industri.

Kryptogruppen Tron vil blive børsnoteret i USA ge…
Hong Kong-baserede kryptovaluta-iværksætter Justin Suns blockchain-virksomhed, Tron, forbereder sig på at blive børsnoteret i USA gennem en omvendt fusion med SRM Entertainment (SRM.O).