Нова модель "Fugatto" від Nvidia покращує генеративний штучний інтелект, трансформуючи музику, голоси та звуки, навіть створюючи раніше нечувані звуки. Хоча вона ще не доступна для загального користування, приклади на веб-сайті демонструють її здатність змінювати аудіо характеристики — від саксофонів, що звучать як гавкіт, до підводної мови або хору сирен швидкої допомоги. Ця широкі можливості дозволили Nvidia описати Fugatto як "швейцарський ніж для звуків". Виклик полягає в створенні набору навчальних даних, що акцентує значущі зв'язки між аудіо і мовою. Дослідники Nvidia, використовуючи LLM-генерований Python-скрипт, створили численні шаблонні та вільні інструкції для опису аудіо "персон". Їх застосували до широкого спектру аудіо даних з відкритим кодом, позначивши їх природними мовними описами, оціненими за емоціями, гендерною приналежністю і якістю мови. Дослідники утримували певні фактори постійними, одночасно змінюючи інші, щоб навчити модель розрізняти, наприклад, радіснішу мову чи різні інструментальні звуки. Після обробки 20 мільйонів зразків (50, 000 годин аудіо) вони використовували тензорні ядра Nvidia для розробки моделі з 2. 5 мільярдами параметрів, що демонструє надійні оцінки якості аудіо. Поза навчанням, система Fugatto під назвою "ComposableART" дозволяє налаштовувати аудіо вивід.
Вона поєднує характеристики зі свого набору даних для створення нових, нечуваних звуків, використовуючи "умовне направлення" для невидимих комбінацій. Хоча не всі результати ідеальні за тоном, різноманітність звуків, як скрипка, що звучить як сміючийся немовля, демонструє трансформативну здатність Fugatto. Важливо, що Fugatto розглядає аудіо характеристики як настроювані континууми, а не двійкові величини. Вона поєднує звуки, як акустичну гітару з звуком води, змінюючи баланс, та налаштовує акценти чи емоції в мові. Вона виконує завдання на кшталт зміни емоційності висловленого тексту, виділення вокальних доріжок або заміни нот у MIDI-музиці з різними вокальними виконаннями. Nvidia бачить Fugatto як крок до несупервізованого багатозадачного навчання і передбачає його застосування у прототипуванні пісень та динамічних музичних доріжках для відеоігор. Такі моделі призначені бути інструментами для аудіо-артистів, а не замінами. Як зазначає продюсер/автор пісень Ідо Змішлані, технології безперервно змінюють музику, з AI відкриваючи новий розділ в музичних інноваціях.
Fugatto від Nvidia: революція у генеративному штучному інтелекті для звуку.
Всеосяжне нове дослідження компанії Hostinger виявило зростаючий вплив штучного інтелекту на цифровий ландшафт, особливо у сфері пошуку онлайн-контенту.
У швидкозмінному світі цифрового маркетингу бізнеси все більше використовують штучний інтелект (ШІ) для покращення своїх рекламних зусиль.
OpenAI у партнерстві з Oracle та SoftBank презентували амбітний проект «Stargate» — ініціативу вартістю 400 мільярдів доларів, спрямовану на значне розширення інфраструктури штучного інтелекту.
Amazon розпочала масштабну ініціативу під назвою Project Rainier, спрямовану на створення величезного $11 мільярдів центру обробки даних із штучного інтелекту на території площею 1200 акрів у штаті Індіана.
Проспектинг еволюціонував у переважно задачу управління увагою, а не через нестачу лідов.
Штучний інтелект (ШІ) швидко перетворює цифровий маркетинг, особливо в галузі пошукової оптимізації (SEO).
За останні роки сфера розробки відеоігор зазнала глибоких змін, зокрема завдяки інтеграції технологій штучного інтелекту (ШІ).
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today