lang icon English
Dec. 12, 2024, 9:04 a.m.
2600

Harvard avaldab andmekogu miljoni avalikus omandis oleva raamatu kohta tehisintellekti koolitamiseks.

Brief news summary

Harvardi Ülikool plaanib avaldada andmekogu, mis sisaldab ligikaudu 1 miljon avalikus omandis olevat raamatut. Need teosed, mis hõlmavad erinevaid žanre ja keeli, sisaldavad autoreid nagu Dickens, Dante ja Shakespeare ning ei kuulu enam autoriõiguse alla nende vanuse tõttu. Andmekomplekti avaldamise kuupäev ja meetod on veel kinnitamata. Raamatud on pärit Google'i ulatuslikust raamatute skannimise projektist Google Books ning Google aitab selle väärtusliku kogu levitamisel. Harvard tutvustas märtsis institutsionaalsete andmete algatust (IDI), mille eesmärk on luua usaldusväärne juriidiliste andmete allikas tehisintellekti eesmärkide jaoks. Täna toimub IDI ametlik käivitamine, avalikustades Microsofti ja OpenAI rahalise toetuse. See algatus rõhutab AI koolitusandmete kõrgeid kulusid, mis sageli on taskukohased ainult suurettevõttetega. Projekt püüab teha põhialusena vajalikud andmed paremini kättesaadavaks, kasutades ära Google'i koostööd, et suurendada selle muljetavaldava andmekogu haardeulatust.

Tehisintellekti treeningandmed võivad olla üsna kulukad, olles sageli kättesaadavad peamiselt jõukatele tehnoloogiaettevõtetele. Selle leevendamiseks kavatseb Harvardi Ülikool avaldada andmestiku umbes miljonist avalikus domeenis olevast raamatust.

Need raamatud, mille autoriteks on näiteks Dickens, Dante ja Shakespeare, ei kuulu autoriõiguse alla nende vanuse tõttu ning hõlmavad erinevaid žanreid ja keeli. Andmestik pole veel kättesaadav ja selle avaldamise üksikasjad on ebaselged. Raamatud pärinevad Google'i pikaajalisest raamatute skaneerimise projektist Google Books ning Google aitab selle "vara hulga" laialdaselt kättesaadavaks teha. Harvard teatas märtsis institutsionaalsest andmete algatusest (IDI), mille eesmärk on pakkuda "usaldusväärset kanalit legaalsetele andmetele tehisintellekti jaoks. " Kuni tänaseni olid üksikasjad napid, kuid nüüd on kinnitatud, et IDI-d toetavad rahaliselt Microsoft ja OpenAI.


Watch video about

Harvard avaldab andmekogu miljoni avalikus omandis oleva raamatu kohta tehisintellekti koolitamiseks.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 12, 2025, 1:31 p.m.

Coca-Cola tehisintellekti pühadetegel kutsub kaas…

Coca-Cola, mida on pikka aega tähistatud ikoonilise jõulukampaania kaudu, on saanud märkimisväärset kriitikat oma 2025.

Nov. 12, 2025, 1:26 p.m.

SMM piloot pakub tehisintellektipõhist kasvuplatv…

SMM Pilot on arenenud tehisintellekti võimendusega kasvulava, mis muudab väikeste ja keskmise suurusega ettevõtete (VKE-de) e-kaubanduses ja sidusprogrammides oma sotsiaalmeedia kohalolu ning digitaalse turunduse strateegiaid.

Nov. 12, 2025, 1:23 p.m.

3 viisi, kuidas turundusdirektorid saavad kasutad…

Tehis on liikumas lootustandvalt kontseptsilt põhjalikuks osaks turundusoperatsioonidest.

Nov. 12, 2025, 1:18 p.m.

Kling AI: Hiina teksti-pildi mudel

Kling AI, mille lõi Hiina tehnoloogiafirma Kuaishou ja mille kasutuselevõtt toimus juunis 2024, on märkimisväärne läbimurre tehisintellekti toel sisuloome valdkonnas, spetsialiseerudes loomuliku keele tekstide tõlkimisele kvaliteetseteks videoteks.

Nov. 12, 2025, 1:17 p.m.

Tehisintellekti täiustatud SEO-analüütika: sügava…

Tehisintellekt muudab põhimõtteliselt otsingumootori optimeerimise (SEO) analüütikat, suunates sisse uue ajastu andmepõhise turundusstrateegia.

Nov. 12, 2025, 1:11 p.m.

CoreWeave'i väärtuse tõus suureneb tehisintellekt…

CoreWeave, juhtiv tehisintellekti infrastruktuuri pakkuja, on näinud olulist hinnanguläbirääkimise kasvu ning laieneb kiiresti kasvavas tehisintellekti sektoris.

Nov. 12, 2025, 9:24 a.m.

Inimeste tagasitulek turundusse?

Viimastel aastatel on tehisintellekt (AI) muutnud paljusid tööstusharusid, eriti reklaami, võimaldades kiiret ja laiaulatuslikku sisu loomist.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today