lang icon English
Jan. 9, 2025, 4:08 a.m.
2848

МИТ развива вештачка интелигенција за имитација на глас сличен на човечкиот.

Brief news summary

Истражувачите од CSAIL на MIT развија напреден систем со вештачка интелигенција кој може убедливо да имитира човечки вокални и еколошки звуци, моделирајќи го човечкиот вокален тракт. Оваа вештачка интелигенција, инспирирана од когнитивната наука, може да реплицира различни звуци како шум на лисја и сирени и да препознава реални звуци преку своите миметички способности. Иновацијата нуди "имитациони" интерфејси за дизајнери на звуци и може да го подобри реализамот на AI карактерите во виртуелната реалност. За време на тестовите, судиите ги претпочитаа имитациите на вештачката интелигенција во 25% од случаите, особено нејзината репродукција на звуците од моторен чамец. Предводени од докторантите Картик Чандра и Карима Ма, заедно со студентот Метју Карен, истражувачкиот тим создаде три верзии на вештачката интелигенција. Последната верзија го подобрува имитирањето на звуците преку вклучување на резонирање и контекст, прилагодување на брзината и волуменот за апстрактни аудитивни скици. Иако се бори со некои согласки, вештачката интелигенција има бројни потенцијални апликации. Филмаџии и музичари би можеле да ги искористат овие можности, додека исто така би можела да даде увид за развој на јазикот и анализата на птичините песни. Ова истражување нуди вредни перспективи за еволуцијата на јазикот и ономатопејата, истакнувајќи ја важноста на физиологијата, социјалното резонирање и комуникацијата во вокалната имитација. Финансирано од Фондацијата Херц и NSF, студијата го подобрува разбирањето на аудитивната апстракција и изразување.

Способноста да ги имитираме звуците со нашиот глас, како неисправен автомобилски мотор или мјаукање на мачка, може да биде ефективен начин за пренесување на концепти кога зборовите не се доволни. Оваа гласовна имитација е слична на цртање брз нацрт за да се пренесе идеја. Инспирирани од когнитивната наука, истражувачи од CSAIL на MIT развија систем за вештачка интелигенција кој може да создаде имитации на човечки глас без претходна обука или изложеност на човечки вокални импресии. Истражувачите конструирале модел на човечкиот гласовен тракт, симулирајќи како грлото, јазикот и усните создаваат звуци од гласовната кутија. Когнитивно инспириран алгоритам на вештачка интелигенција го контролира овој модел за да произведе имитации, земајќи предвид како луѓето избираат да ги комуницираат звуците. Моделот може да имитира различни звуци, како шум на лисја, шишкање на змија и сирена на амбуланта. Исто така, може да го обратни процесот, одгатнувајќи звуци од реалниот свет од човечки вокални имитации, слично на извлекување слики од нацрти. На пример, може да разликува помеѓу човечки имитираните „мјау“ и „шишкање“ на мачка. Истражувањето сугерира потенцијални употреби на моделот, како интерфејси базирани на имитација за дизајнери на звук, подобрување на AI карактери во виртуелната реалност и помош за изучувачи на јазик.

Ко-водечките автори од CSAIL на MIT истакнуваат дека, како и во визуелната изразливост, реализамот не е секогаш крајната цел во имитацијата на звуците. Нивната работа нуди увид во аудитивна апстракција. За да го подобрат својот модел, тимот разви три верзии, почнувајќи со основен модел кој се стремеше кон реалистична имитација на звук, но не совпаѓаше добро со човечкото однесување. Потоа создадоа „комуникативен“ модел кој се фокусираше на карактеристиките на звукот, што го подобри резултатите. Конечно, додадоа нијанси кои ја земаат предвид вложената човечка напредност во имитацијата, што доведе до пореални човечки резултати. Во бихевиористички експеримент, човечки судии понекогаш претпочитаа вокални имитации генерирани од вештачката интелигенција пред човечките за специфични звуци. Истражувачите имаат за цел да го применат својот модел во различни области, вклучувајќи го развојот на јазик, учењето на говор кај доенчињата и однесувањето на птичките имитации. Иако моделот сѐ уште се соочува со предизвици, како точно имитирање на некои согласки или разлики во звуците меѓу јазиците, тој нуди ветувачки чекор кон подлабоко разбирање на улогата на вокалната имитација во комуникацијата и еволуцијата на јазикот. Работата го истакнува спојот помеѓу физиолошките, социјалните и комуникативните фактори, со импликации за идни технологии во музиката, уметноста и понатаму.


Watch video about

МИТ развива вештачка интелигенција за имитација на глас сличен на човечкиот.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 17, 2025, 1:26 p.m.

Иновации во видео маркетингот со вештачката интел…

Изкуствената интелигенција (ИИ) секогаш повеќе игра клучна улога во видеомаркетингот, transformирајќи го начинот на кој брендови се поврзуваат со своите целни публикации.

Nov. 17, 2025, 1:26 p.m.

Законодавецот на 6sense, Amanda Kahlow, собра $30…

И покрај тоа што АИ агенти пилотирани од големи јазични модели (LLMs) се релативно нови, тие стекнаа значајна популарност во продажбата.

Nov. 17, 2025, 1:20 p.m.

Содржина генерирана од вештачка интелигенција во …

Последниот сеопфатен преглед на оценувањето на вештачката интелигенција (ВИ) во маркетингот на социјалните мрежи (СММ) открива значајни разлики во перформансите помеѓу содржината генерирана од ВИ и онаа создадена од луѓе.

Nov. 17, 2025, 1:13 p.m.

SEO со вештачка интелигенција: иднината на дигита…

Вештачката интелигенција (AI) брзо ја преобразува оптимизацијата на пребарувачите (SEO), овозможувајќи на маркетерите неверојатни можности за подобрување на онлајн видливоста и рангирањето на пребарувачите.

Nov. 17, 2025, 1:11 p.m.

Џеф Безос ќе води нова инженерски ориентирана ком…

Џеф Безос води нова стартап компанија за вештачка интелигенција наречена Проект Прометей, која се согласува со неговите тековни интереси во областите на вселената и инженерството, според Њујорк Тајмс.

Nov. 17, 2025, 1:10 p.m.

Антропик направи голема најава која може да го тр…

Во овој видео запис, ги разгледувам најновите случувања кои влијаат врз Алфабет (GOOG +3.33%) (GOOGL +3.39%) заедно со други акции поврзани со вештачка интелигенција.

Nov. 17, 2025, 9:30 a.m.

Дали BigBear.ai може да стане следната Палантир Т…

Палантир Текнолошииз (PLTR) постигна исклучителен перформанс на акциите, со раст од повеќе од 186% во последната година до 14 ноември.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today