**Nota dell'Editore**: Questa analisi fa parte dell'osservazione di The Atlantic sul dataset di Library Genesis. Accedi allo strumento di ricerca di The Atlantic per la scrittura di film e televisioni utilizzato per addestrare l'IA qui. Quando Meta ha iniziato a creare il suo modello AI, Llama 3, il team si è trovato di fronte a un dilemma etico: acquisire una grande quantità di testi di qualità legalmente era lento e costoso. Hanno considerato la pirateria dei dati dopo essere stati insoddisfatti delle opzioni di licensing, citando costi elevati e consegne ritardate da potenziali partner. Le discussioni interne hanno rivelato un forte desiderio di utilizzare libri, considerati essenziali per l'addestramento, spingendoli a esplorare Library Genesis (LibGen), un grande repository di letteratura e ricerca piratata. Le comunicazioni interne hanno rivelato che i dipendenti di Meta cercavano l'approvazione del CEO Mark Zuckerberg per utilizzare il dataset di LibGen, ora pubblico a causa di una causa legale sul copyright da parte di diversi autori. Inoltre, OpenAI è stata associata a LibGen in casi d'uso passati. Sebbene non sia chiaro l'ambito completo dei testi su cui entrambe le aziende hanno effettuato l'addestramento—il contenuto di LibGen viene costantemente aggiornato—il database contiene milioni di titoli, inclusi opere significative e articoli accademici. Meta e OpenAI difendono i loro approcci sotto l'affermazione di "uso leale", sostenendo che la loro IA generativa trasforma le fonti in nuovi contenuti. Tuttavia, l'utilizzo di LibGen solleva questioni critiche, in particolare poiché i documenti interni indicano che Meta ha scaricato dati tramite BitTorrent, il che comporta rischi legali a causa della potenziale distribuzione di contenuti piratati.
Meta ha insistito di aver preso precauzioni contro il seeding di file. I dipendenti hanno riconosciuto i rischi legali, discutendo strategie per nascondere le loro attività, come evitare riferimenti a opere protette da copyright e filtrare informazioni identificabili. LibGen, significativamente più grande di altre collezioni di opere piratate, attrae gli sviluppatori di IA grazie alla sua ampia selezione, includendo letteratura contemporanea e riviste accademiche. Fondata nel 2008 da scienziati russi, LibGen serve aree con accesso limitato a risorse educative. La sua crescita è stata alimentata dai contributi di materiali piratati, portando a una predominanza di testi in inglese nel tempo. Nonostante i molteplici tentativi da parte degli editori di contrastare la pirateria, comprese rilevanti sentenze e multe contro LibGen, il repository persiste. Questa accessibilità solleva preoccupazioni etiche riguardo al lavoro sottostante degli autori, che spesso non ricevono riconoscimenti né compensi. Le tecnologie di intelligenza artificiale generativa rischiano di decontestualizzare la conoscenza e minare il riconoscimento dovuto ai creatori originali. La sfida centrale rimane come bilanciare efficacemente la diffusione della conoscenza e del lavoro creativo per il beneficio della società, mentre aziende come Meta capitalizzano su queste risorse per profitto, potenzialmente diminuendo il valore dell'impegno intellettuale umano.
Il dilemma etico di Meta: utilizzare Library Genesis per l'addestramento dell'IA.
Foto di Paulina Ochoa, Digital Journal Mentre molti cercano carriere legate alla tecnologia AI, quanto sono accessibili questi ruoli? Uno studio recente della piattaforma di formazione digitale EIT Campus identifica i lavori di AI più facili da intraprendere in Europa entro il 2026, dimostrando che alcune posizioni richiedono solo da 3 a 6 mesi di formazione senza bisogno di una laurea in informatica
L'industria dei videogiochi si sta trasformando rapidamente grazie all'integrazione delle tecnologie di intelligenza artificiale (IA), modificando radicalmente il modo in cui i giochi vengono sviluppati e vissuti dai giocatori.
Alphabet Inc., la società madre di Google, ha annunciato un accordo per l'acquisizione di Intersect, una società specializzata in soluzioni energetiche per data center, per 4,75 miliardi di dollari.
L'Intelligenza Artificiale (IA) è diventata sempre più uno strumento indispensabile nel Search Engine Optimization (SEO), rivoluzionando il modo in cui i marketer gestiscono la creazione di contenuti, la ricerca di parole chiave e le strategie di coinvolgimento degli utenti.
Virgin Voyages si è alleata con Canva diventando la prima grande compagnia di crociere ad implementare strumenti di marketing basati sull’intelligenza artificiale su larga scala per la sua rete di consulenti di viaggio.
AIMM: Un Framework Innovativo Basato sull'Intelligenza Artificiale per Rilevare Manipolazioni del Mercato Azionario Influenzate dai Social Media Nell'odierno ambiente di trading azionario in rapido cambiamento, i social media sono emersi come una forza chiave nel plasmare le dinamiche di mercato
La società di tecnologia legale Filevine ha acquisito Pincites, una piattaforma di revisione contrattuale guidata dall’intelligenza artificiale, rafforzando la sua presenza nel diritto societario e transazionale e avanzando la sua strategia incentrata sull’AI.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today