Het onderzoek van The Atlantic naar de OpenSubtitles-dataset onthult dat vele generatieve AI-systemen zijn getraind met behulp van tv- en filmscripts, waaronder die van meer dan 53. 000 films en 85. 000 tv-afleveringen. Deze systemen zijn ontwikkeld door grote bedrijven zoals Apple, Meta, Nvidia en Salesforce, gebruikmakend van een dataset die dialogen bevat uit films en series zoals "The Godfather, " "The Simpsons" en "Breaking Bad. " De gegevens, afkomstig van OpenSubtitles. org, bestaan uit ondertitelbestanden die door gebruikers zijn geëxtraheerd en geüpload. Deze methode biedt een rijke bron van dialogen, essentieel voor het trainen van AI om natuurlijke spraak na te bootsen. Verschillende AI-modellen, zoals Claude van Anthropic en iPhone-compatibele LLM's van Apple, zijn op deze data getraind. Deze ontwikkelingen hebben echter zorgen gewekt onder Hollywood-schrijvers en -artiesten, die zich afvragen of hun werk zonder toestemming wordt gebruikt.
Juridische uitdagingen omtrent het gebruik van auteursrechtelijk beschermd materiaal bij AI-training zijn gaande, en de transparantie van technologiebedrijven blijft beperkt. Terwijl sommige makers, zoals Jörg Tiedemann, een oorsprong van de OpenSubtitles-dataset, tevreden zijn met het bredere gebruik ervan, beschouwen anderen het als een inbreuk op intellectueel eigendom. De OpenSubtitles-dataset maakt deel uit van een grotere collectie genaamd The Pile, die diverse teksten omvat en veel wordt gebruikt door AI-ontwikkelaars. Ondanks de beschikbaarheid is de inhoud complex en vereist specifieke tools om te navigeren. Terwijl AI zich blijft ontwikkelen, roept het gebruik van creatieve inhoud zonder toestemming of vergoeding ethische en juridische dilemma's op die nog onopgelost zijn.
AI-training op OpenSubtitles: Ethische en Juridische Uitdagingen
Elke week belichten we een AI-gedreven app die echte problemen oplost voor B2B- en Cloud-bedrijven.
Kunstmatige intelligentie (AI) beïnvloedt steeds meer de lokale zoekmachineoptimalisatie (SEO) strategieën.
IND Technology, een Australisch bedrijf dat zich specialiseert in het monitoren van infrastructuur voor nutsvoorzieningen, heeft 33 miljoen dollar aan groeifinanciering veiliggesteld om haar AI-gedreven inspanningen ter voorkoming van bosbranden en stroomuitval te versterken.
De afgelopen weken hebben steeds meer uitgevers en merken aanzienlijke terugslag gekregen terwijl ze experimenteren met kunstmatige intelligentie (AI) in hun contentproductieprocessen.
Google Labs, in samenwerking met Google DeepMind, heeft Pomelli geïntroduceerd, een AI-gestuurd experiment ontworpen om kleine tot middelgrote bedrijven te helpen bij het ontwikkelen van marketingcampagnes die aansluiten bij hun merk.
In het snel groeiende digitale landschap van vandaag gebruiken sociale medianetwerken steeds vaker geavanceerde technologieën om hun online gemeenschappen te beschermen.
Een versie van dit verhaal verscheen in CNN Business’ Nightcap nieuwsbrief.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today