lang icon En
Dec. 12, 2024, 9:04 a.m.
2930

Harvard publiceert dataset van 1 miljoen boeken in het publieke domein voor AI-training.

Brief news summary

Harvard University is van plan om een dataset uit te brengen met ongeveer 1 miljoen boeken in het publieke domein. Deze werken, die verschillende genres en talen bestrijken, omvatten auteurs als Dickens, Dante en Shakespeare, en zijn niet langer auteursrechtelijk beschermd vanwege hun ouderdom. De releasedatum en -methode voor deze dataset zijn nog niet bevestigd. De boeken zijn afkomstig van Google's uitgebreide boeken-scanproject, Google Books, en Google zal helpen bij de distributie van deze waardevolle collectie. Harvard introduceerde in maart het Institutionele Data-initiatief (IDI), met als doel een betrouwbare bron van legale data voor AI-doeleinden te creëren. Vandaag markeert de formele lancering van het IDI, waarbij financiële steun van Microsoft en OpenAI wordt onthuld. Dit initiatief benadrukt de hoge kosten die gepaard gaan met AI-trainingsdata, die vaak alleen betaalbaar zijn voor grote technologiebedrijven. Het project streeft ernaar essentiële data toegankelijker te maken en maakt gebruik van de samenwerking met Google om het bereik van deze indrukwekkende dataset te maximaliseren.

Trainingsgegevens voor AI kunnen behoorlijk kostbaar zijn en zijn vaak alleen toegankelijk voor rijke technologiebedrijven. Om dit tegen te gaan, is de Harvard University van plan om een dataset van ongeveer 1 miljoen boeken uit het publieke domein te publiceren. Deze boeken, geschreven door auteurs als Dickens, Dante en Shakespeare, vallen buiten het auteursrecht vanwege hun leeftijd en bestrijken verschillende genres en talen. De dataset is nog niet beschikbaar en details over de release blijven onduidelijk.

De boeken zijn afkomstig van het al lang bestaande boekenscanproject van Google, Google Books, en Google zal helpen om deze "schat" breed toegankelijk te maken. Harvard kondigde in maart het Institutional Data Initiative (IDI) aan, dat bedoeld is om een "vertrouwde doorvoer voor legale data voor AI" te bieden. Tot op heden waren de details schaars, maar nu is bevestigd dat IDI financieel wordt ondersteund door Microsoft en OpenAI.


Watch video about

Harvard publiceert dataset van 1 miljoen boeken in het publieke domein voor AI-training.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 9:22 a.m.

OpenAI ziet betere marges op zakelijke verkopen, …

De publicatie stelde dat het bedrijf zijn "compute-marge" heeft versterkt, een interne maatstaf die het deel van de omzet weergeeft dat overblijft na het dekken van de kosten van operationele modellen voor betalende gebruikers van zijn bedrijfs- en consumentenproducten.

Dec. 22, 2025, 9:19 a.m.

AI-video generatoren maken gepersonaliseerde mark…

In het snel veranderende veld van digitale marketing speelt kunstmatige intelligentie (AI) een cruciale rol in het hervormen van de manier waarop merken contact maken met hun publiek.

Dec. 22, 2025, 9:15 a.m.

Het inzetten van AI voor SEO: Best practices en t…

Naarmate kunstmatige intelligentie (AI) vordert, groeit de betekenis ervan in zoekmachineoptimalisatie (SEO) aanzienlijk.

Dec. 22, 2025, 9:14 a.m.

Het ontcijferen van de impact van AI op reclame e…

Kunstmatige intelligentie (AI) verandert de reclame- en marketingindustrie fundamenteel en markeert daarmee een ingrijpende verschuiving die verder gaat dan eerdere technologische vooruitgang.

Dec. 22, 2025, 9:12 a.m.

Nvidia: slechts een opslag van 3% voor het belang…

Nvidia: slechts een premie van 3% voor het belangrijkste AI-bedrijf De J-these 1,32K Volgers Reacties (11) Samenvatting De waardering blijft redelijk: Nvidia wordt verhandeld tegen ongeveer 24 keer de verwachte winst, slechts zo'n 3% boven het gemiddelde van de S&P 500, ondanks aanzienlijk sterkere omzet, EPS-groei en marges

Dec. 22, 2025, 5:21 a.m.

"AI SMM", nieuwe training van Hallakate – Leer ho…

In een tijd waarin technologie de manier waarop we content creëren en sociale netwerken beheren transformeert, introduceert Hallakate nieuwe trainingen op maat voor dit nieuwe tijdperk: AI SMM.

Dec. 22, 2025, 5:19 a.m.

Verkoopmarkt voor AI-trainings-GPU-clusters | CAG…

Overzicht van het Rapport De wereldwijde markt voor de verkoop van GPU-clusters voor AI-training wordt naar verwachting ongeveer USD 87,5 miljard bereiken in 2035, ten opzichte van USD 18,2 miljard in 2025, met een CAGR van 17,0% tussen 2026 en 2035

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today