**Примітка редактора**: Цей аналіз є частиною дослідження Atlantic про набір даних Library Genesis. Доступ до інструменти пошуку Atlantic для сценаріїв фільмів і телевізійних програм, що використовуються для навчання ШІ, можна знайти тут. Коли Meta почала створювати свою модель ШІ, Llama 3, команда зіткнулася з етичною дилемою: легально отримати величезну кількість якісного тексту було повільно і витратно. Вони розглянули можливість піратства даних, будучи незадоволеними варіантами ліцензування, через високі витрати і затримки в доставці від потенційних партнерів. Внутрішні обговорення виявили сильне бажання використовувати книги, які вважалися необхідними для навчання, що спонукало їх дослідити Library Genesis (LibGen), великий репозиторій піратської літератури та досліджень. Внутрішні комунікації показали, що співробітники Meta шукали схвалення від генерального директора Марка Цукерберга для використання набору даних LibGen, який тепер є публічним через судовий позов з авторських прав від кількох авторів. Більше того, OpenAI також пов’язаний з LibGen у минулих випадках використання. Хоча повний обсяг текстів, на яких навчаються обидві компанії, залишається невизначеним — вміст LibGen постійно оновлюється — база даних містить мільйони назв, зокрема значні твори та наукові статті. Meta і OpenAI захищають свої підходи під ствердженням про "добросовісне використання", стверджуючи, що їхній генеративний ШІ трансформує джерела в новий контент. Однак використання LibGen піднімає критичні питання, особливо оскільки внутрішні документи вказують, що Meta завантажувала дані через BitTorrent, що несе правові ризики через можливий розподіл піратського контенту.
Meta запевняла, що вжила заходів, щоб уникнути поширення файлів. Співробітники визнали правові ризики, обговорюючи стратегії приховування своєї діяльності, такі як уникнення посилань на авторські твори та фільтрація ідентифікаційної інформації. LibGen, значно більший за інші колекції піратських матеріалів, приваблює розробників ШІ через широкий вибір, зокрема сучасну літературу та академічні журнали. Заснований у 2008 році російськими вченими, LibGen слугує районам з обмеженим доступом до освітніх ресурсів. Його зростання було підштовхнуто внесками піратських матеріалів, що призвело до переважання англомовних текстів з плином часу. Незважаючи на численні спроби видавців обмежити піратство, включаючи значні судові рішення та штрафи проти LibGen, репозиторій продовжує існувати. Ця доступність піднімає етичні питання щодо основної праці авторів, які часто не отримують кредиту або винагороди. Технології генеративного ШІ ризикують дехто контекстуалізувати знання і підривати визнання, яке належить оригінальним творцям. Головним викликом залишається ефективний баланс між розповсюдженням знань та креативної роботи на користь суспільства, оскільки такі компанії, як Meta, використовують ці ресурси для отримання прибутку, що потенційно зменшує цінність людської інтелектуальної діяльності.
Етична дилема Meta: використання Library Genesis для навчання ШІ
Bloomberg Компанія Micron Technology Inc, найбільший американський виробник пам’ятних чіпів, оприлюднила оптимістичний прогноз на поточний квартал, вказуючи, що зростаючий попит і дефіцит пропозиції дозволяють компанії встановлювати вищі ціни на свою продукцію
Згідно з недавнім дослідженням Boston Consulting Group (BCG), довіра провідних фахівців у сфері реклами до генеративного штучного інтелекту (ШІ) досягає безпрецедентного рівня.
Недавно компанія Google DeepMind презентувала AlphaCode — передову систему штучного інтелекту, створену для написання комп’ютерного коду на рівні, comparableному з людськими програмістами.
У міру швидкої еволюції цифрового середовища інтеграція штучного інтелекту (ШІ) у стратегії пошукової оптимізації (SEO) стала необхідною для успіху в Інтернеті.
Виникнення штучного інтелекту (ШІ) у модній індустрії викликало активні дебати серед критиків, творців і споживачів.
У сучасному швидкозмінному світі, де аудиторії часто важко приділяти час довгим новинним матеріалам, журналісти все частіше впроваджують інноваційні технології для вирішення цієї проблеми.
Технології штучного інтелекту революціонізують створення відеоконтенту, головним чином завдяки появі інструментів відеомонтажу, підтримуваних ШІ.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today