**Nota Editor**: Analisis ini adalah sebahagian daripada tinjauan The Atlantic terhadap dataset Library Genesis. Akses alat carian The Atlantic untuk penulisan filem dan televisyen yang digunakan untuk melatih AI di sini. Apabila Meta mula mencipta model AI-nya, Llama 3, pasukan tersebut menghadapi dilema etika: memperoleh sejumlah besar teks berkualiti secara sah adalah perlahan dan mahal. Mereka mempertimbangkan untuk mencuri data setelah tidak berpuas hati dengan pilihan pelesenan, yang dianggap mahal dan memerlukan masa lama untuk penghantaran dari rakan kongsi yang berpotensi. Perbincangan dalaman menunjukkan keinginan yang kuat untuk menggunakan buku, yang dianggap penting untuk latihan, mendorong mereka untuk meneroka Library Genesis (LibGen), sebuah repositori besar sastera dan penyelidikan yang dicuri. Komunikasi dalaman mendedahkan bahawa pekerja Meta meminta kebenaran daripada CEO Mark Zuckerberg untuk menggunakan dataset LibGen, yang kini terbuka kepada umum kerana tuntutan hak cipta daripada beberapa penulis. Selain itu, OpenAI juga telah dikaitkan dengan LibGen dalam kes penggunaan masa lalu. Walaupun skop penuh teks yang dilatih oleh kedua-dua syarikat adalah tidak jelas—kandungan LibGen sentiasa dikemas kini—pangkalan data tersebut mengandungi jutaan tajuk, termasuk karya penting dan kertas akademik. Meta dan OpenAI mempertahankan pendekatan mereka berdasarkan pengakuan "penggunaan adil, " dengan alasan bahawa AI generatif mereka mengubah sumber kepada kandungan baru. Namun, penggunaan LibGen menimbulkan isu kritikal, terutama kerana dokumen dalaman menunjukkan Meta memuat turun data melalui BitTorrent, yang mempunyai risiko undang-undang disebabkan potensi pengedaran kandungan yang dicuri.
Meta telah menegaskan bahawa mereka mengambil langkah berjaga-jaga terhadap penyaluran fail. Para pekerja mengakui risiko undang-undang, membincangkan strategi untuk menyembunyikan aktiviti mereka, seperti mengelakkan rujukan kepada karya berhak cipta dan menyaring maklumat yang boleh dikenal pasti. LibGen, yang jauh lebih besar daripada koleksi lanun lain, menarik pengembang AI kerana pemilihan luasnya, termasuk sastera kontemporari dan jurnal akademik. Ditubuhkan pada 2008 oleh saintis Rusia, LibGen berfungsi di kawasan dengan akses terhad kepada sumber pendidikan. Pertumbuhannya didorong oleh sumbangan bahan yang dicuri, yang membawa kepada dominasi teks bahasa Inggeris dari masa ke masa. Walaupun terdapat banyak usaha oleh penerbit untuk membendung pem piracy, termasuk keputusan mahkamah yang signifikan dan denda terhadap LibGen, repositori tersebut terus bertahan. Aksesibiliti ini menimbulkan kebimbangan etika mengenai karya asal penulis, yang sering kali tidak menerima kredit atau pampasan. Teknologi AI-generatif berisiko mengeluarkan pengetahuan dari konteks dan melemahkan pengiktirafan yang sepatutnya diberikan kepada pencipta asal. Cabaran utama tetap bagaimana untuk secara berkesan menyeimbangkan penyebaran pengetahuan dan karya kreatif untuk manfaat masyarakat, ketika syarikat seperti Meta mengambil kesempatan daripada sumber ini untuk keuntungan, yang berpotensi mengurangkan nilai penglibatan intelektual manusia.
Dilema Etika Meta: Menggunakan Library Genesis untuk Latihan AI
Kecerdasan Buatan (AI) memainkan peranan yang semakin penting dalam merevolusikan pengoptimuman enjin carian tempatan (SEO), menawarkan perniagaan cara inovatif untuk meningkatkan kehadiran mereka dalam talian dalam kawasan geografi tertentu.
Essai yang bercorak 'cerita sendiri' ini berasaskan perbualan dengan Aurora Bryant, 40 tahun, ketua utama maklumat kecerdasan data undang-undang di Relativity di New York.
Seluruh dunia semakin mengadopsi sistem pengawasan video berkuasa AI untuk meningkatkan keselamatan awam dan memantau persekitaran bandar dengan lebih baik.
Di SMM 2024, pameran perdagangan maritim antarabangsa utama yang diadakan di Hamburg, peranan penting kecerdasan buatan (AI) dalam mempercepat transformasi digital industri maritim dipersembahkan secara menonjol.
Demokrat Kongres menyampaikan kebimbangan serius mengenai kemungkinan bahawa Amerika Syarikat akan mula menjual cip canggih kepada salah satu pesaing geopolitik utamanya tidak lama lagi.
Google DeepMind baru-baru ini memperkenalkan satu sistem kecerdasan buatan inovatif yang dipanggil AlphaCode, menandakan lonjakan penting dalam pembangunan perisian yang dibantu AI.
OpenAI dilaporkan sedang bersedia untuk mengumpul dana baharu sehingga US$100 bilion, berpotensi meningkatkan penilaiannya kepada US$830 bilion yang menakjubkan.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today