Harvard će objaviti skup podataka od 1 milion knjiga iz javnog domena za obuku AI-a.
Brief news summary
Univerzitet Harvard planira objaviti skup podataka koji sadrži oko milion knjiga iz javnog domena. Ova djela, koja obuhvataju različite žanrove i jezike, uključuju autore kao što su Dickens, Dante i Shakespeare, te više nisu zaštićena autorskim pravima zbog starosti. Datum i metoda objavljivanja ovog skupa podataka još nisu potvrđeni. Knjige su preuzete iz opsežnog projekta skeniranja knjiga kompanije Google, Google Books, a Google će pomoći u distribuciji ove vrijedne kolekcije. Harvard je u martu predstavio Inicijativu za institucionalne podatke (IDI), s ciljem uspostavljanja pouzdanog izvora pravnih podataka za AI svrhe. Danas obilježava službeno pokretanje IDI-ja, otkrivajući finansijsku podršku od Microsofta i OpenAI-a. Ova inicijativa naglašava visoke troškove povezane s AI podacima za obuku, koji su često dostupni samo velikim tehnološkim kompanijama. Projekat nastoji učiniti osnovne podatke dostupnijim, koristeći saradnju s Googleom kako bi se maksimalno povećao domet ovog impresivnog skupa podataka.Podaci za obuku AI mogu biti prilično skupi i često su dostupni uglavnom bogatim tehnološkim kompanijama. Kako bi se to ublažilo, Univerzitet Harvard namjerava objaviti skup podataka od oko milion knjiga iz javnog domena. Ove knjige, koje su napisali autori poput Dickensa, Dantea i Shakespearea, nisu zaštićene autorskim pravima zbog svoje starosti i pokrivaju razne žanrove i jezike. Skup podataka još uvijek nije dostupan, a detalji o njegovom objavljivanju ostaju nejasni.
Knjige dolaze iz dugogodišnjeg projekta skeniranja knjiga Google Books, a Google će pomoći da se ovo "bogatstvo" učini široko dostupnim. Harvard je u martu najavio Inicijativu za institucionalne podatke (IDI), koja ima za cilj pružiti "pouzdani kanal za legalne podatke za AI". Do danas su detalji bili oskudni, ali sada je potvrđeno da IDI finansijski podržavaju Microsoft i OpenAI.
Watch video about
Harvard će objaviti skup podataka od 1 milion knjiga iz javnog domena za obuku AI-a.
Try our premium solution and start getting clients — at no cost to you