lang icon English
Nov. 19, 2024, 4:34 a.m.
2697

AI-trening på OpenSubtitles: Etiske og juridiske utfordringer

Brief news summary

Bruken av OpenSubtitles-datasettet i trening av generative AI-modeller har blitt et omstridt tema, spesielt blant Hollywood-forfattere, på grunn av potensielt uautorisert bruk av kreative verk. Dette datasettet, brukt av selskaper som Apple, Meta og Nvidia, inkluderer dialoger fra over 53 000 filmer og 85 000 TV-episoder, og gir rike samtaledata for å forbedre AI-modeller. Imidlertid reiser dets offentlige tilgjengelighet betydelige etiske og juridiske spørsmål angående opphavsrett og "fair use." Selv om det hevdes å være til ikke-kommersiell bruk, stiller rettslige prosesser spørsmål ved om dette krenker opphavsretten, noe som utløser debatter om attribusjon og etikk. Selskaper som Anthropic, Meta og Apple har integrert disse undertekstene i større datasett, som The Pile, noe som hjelper AI-framgangen, men også presenterer potensielle opphavsrettsutfordringer. Disse utviklingene tenner viktige diskusjoner om kunstneres samtykke, teknologiske påvirkninger og uløste spørsmål om kompensasjon og kontroll over kreative verk.

The Atlantics undersøkelse av OpenSubtitles-datasettet avslører at mange generative AI-systemer har blitt trent ved bruk av TV- og filmmanus, inkludert de fra over 53 000 filmer og 85 000 TV-episoder. Disse systemene har blitt utviklet av store selskaper som Apple, Meta, Nvidia og Salesforce, som utnytter et datasett med dialog fra filmer og serier som "Gudfaren, " "The Simpsons" og "Breaking Bad. " Dataene, hentet fra OpenSubtitles. org, består av undertekstfiler som er ekstrahert og lastet opp av brukere. Denne metoden gir en rik dialogkilde, essensiell for å trene AI til å etterligne naturlig tale. Ulike AI-modeller, som Claude av Anthropic og Apples iPhone-kompatible LLM-er, har blitt trent på disse dataene. Imidlertid har disse utviklingene skapt bekymringer blant Hollywood-forfattere og -kunstnere, som er redde for at verkene deres blir brukt uten tillatelse.

Juridiske utfordringer angående bruken av opphavsrettsbeskyttet materiale i AI-trening pågår, og åpenhet fra teknologiselskaper er fortsatt begrenset. Mens noen skapere som Jörg Tiedemann, en opphavsmann til OpenSubtitles-datasettet, er fornøyde med den bredere bruken, ser andre på det som et brudd på intellektuell eiendom. OpenSubtitles-datasettet er en del av en større samling kalt The Pile, som inkluderer mangfoldige tekster og er mye brukt av AI-utviklere. Til tross for tilgjengeligheten, er innholdet komplekst og krever spesifikke verktøy for å navigere. Etter hvert som AI fortsetter å utvikle seg, reiser bruken av kreativt innhold uten samtykke eller kompensasjon etiske og juridiske dilemmaer som fortsatt er uløste.


Watch video about

AI-trening på OpenSubtitles: Etiske og juridiske utfordringer

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 5, 2025, 1:19 p.m.

SLB lanserer nytt AI-produkt for å styrke digital…

SLB, et ledende energiteknologiselskap, har lansert et innovativt kunstig intelligens-verktøy kalt Tela, med mål om å øke automatiseringen betydelig i oljeinndusnetjenester.

Nov. 5, 2025, 1:19 p.m.

AI sitt påvirkning på SEO: Revolusjonerer strateg…

Kunstig intelligens (KI) omformer søkemotoroptimalisering (SEO) på en dyp måte, og endrer fundamentalt hvordan bedrifter utformer sine digitale markedsføringsstrategier og oppnår resultater.

Nov. 5, 2025, 1:16 p.m.

SenseTime og Cambricon samarbeider om å bygge nes…

SenseTime og Cambricon har kunngjort et strategisk partnerskap for å utvikle avansert kunstig intelligens-infrastruktur i fellesskap.

Nov. 5, 2025, 1:15 p.m.

AI-genererte videoer: Fremtiden for personlig mar…

AI-genererte videoer blir raskt en viktig del av tilpassede markedsføringsstrategier, og endrer måten merker knytter seg til sine målgrupper på.

Nov. 5, 2025, 9:21 a.m.

AI-videoanalyse forbedrer sportssendinger og oppl…

Kunstig intelligens (AI) videointelligens analyserer sportssendinger raskt og forvandler måten sport sendes på ved å forbedre seeropplevelsen gjennom detaljerte statistikker, sanntids ytelsesdata og personlig tilpasset innhold basert på individuelle preferanser.

Nov. 5, 2025, 9:21 a.m.

Nvidia blir det første børsnoterte selskapet som …

Den 9.

Nov. 5, 2025, 9:17 a.m.

Vista Social introduserer ChatGPT-teknologi og bl…

Vista Social har gjort et stort gjennombrudd innen sosiale medier-håndtering ved å integrere ChatGPT-teknologi i plattformen, og blir dermed det første verktøyet som inkluderer OpenAI’s avanserte samtale-AI.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today