lang icon En
Jan. 9, 2025, 4:08 a.m.
3268

MIT desenvolupa una IA per a la imitació vocal similar a la humana.

Brief news summary

Els investigadors de CSAIL del MIT han desenvolupat un sistema d'IA avançat que pot imitar convincentment sons vocals humans i ambientals modelant el tracte vocal humà. Aquesta IA, inspirada en la ciència cognitiva, pot replicar diversos sons com el cruixir de les fulles o les sirenes i reconèixer sorolls del món real a través de les seves capacitats mimètiques. La innovació promet interfícies "basades en la imitació" per a dissenyadors de so i pot millorar el realisme de personatges d'IA en realitat virtual. Durant les proves, els jutges van preferir les imitacions de la IA en un 25% dels casos, especialment la seva representació de sons de llanxes. Encapçalat pels candidats a doctorat Kartik Chandra i Karima Ma, junt amb l'estudiant Matthew Caren, l'equip de recerca va crear tres versions de l'IA. La versió final millora la imitació de sons incorporant raonament i context, ajustant la velocitat i el volum per a esbossos auditius abstractes. Malgrat les dificultats amb alguns sons de consonants, l'IA té nombroses aplicacions potencials. Cineastes i músics podrien aprofitar aquestes capacitats, mentre que també podria oferir noves perspectives per al desenvolupament del llenguatge i l'anàlisi del cant dels ocells. Aquesta investigació ofereix perspectives valuoses sobre l'evolució del llenguatge i l'onomatopeia, ressaltant la importància de la fisiologia, el raonament social i la comunicació en la imitació vocal. Finançat per la Fundació Hertz i la NSF, l'estudi millora la comprensió de l'abstracció auditiva i l'expressió.

La capacitat d’imitar sons amb la nostra veu, com el motor defectuós d’un cotxe o el miol d’un gat, pot ser una manera eficaç de transmetre conceptes quan les paraules no són suficients. Aquesta imitació vocal és similar a fer un esbós ràpid per comunicar una idea. Inspirats per la ciència cognitiva, investigadors del CSAIL del MIT han desenvolupat un sistema d’intel·ligència artificial que pot crear imitacions vocals humanes sense cap entrenament previ o exposició a impressions vocals humanes. Els investigadors han construït un model del tracte vocal humà, simulant com la gola, la llengua i els llavis donen forma als sons des de la caixa de veu. Un algoritme d'IA inspirat cognitivament controla aquest model per produir imitacions, considerant com els humans trien comunicar sons. El model pot imitar diversos sons, com el xiuxiueig de fulles, el xiuxiueig d'una serp i la sirena d'una ambulància. També pot fer el procés invers, endevinant sons del món real a partir d'imitacions vocals humanes, semblant a recuperar imatges a partir d’esbossos. Per exemple, pot distingir entre un "mèu" i un "xiscle" imitats per humans. La recerca suggereix usos potencials per al model, com interfícies basades en imitacions per a dissenyadors de so, millorant personatges d'intel·ligència artificial en realitat virtual i ajudant aprenents de llengües.

Els co-autors del MIT CSAIL destaquen que, com en l’expressió visual, el realisme no sempre és l’objectiu final en la imitació de sons. El seu treball ofereix idees sobre l’abstracció auditiva. Per refinar el seu model, l’equip va desenvolupar tres versions, començant per un model base que buscava una imitació de sons realista però no coincidia bé amb el comportament humà. Després van crear un model "comunicatiu" centrat en les característiques distintives d’un so, cosa que va millorar els resultats. Finalment, van afegir matisos tenint en compte l’esforç que els humans dediquen a la imitació, aconseguint resultats més semblants als humans. En un experiment de comportament, jutges humans de vegades van preferir les imitacions vocals generades per IA per sobre de les humanes per a sons específics. Els investigadors tenen com a objectiu aplicar el seu model en diversos camps, incloent-hi el desenvolupament del llenguatge, l'aprenentatge del llenguatge infantil i els comportaments d'imitació dels ocells. Tot i que el model encara afronta desafiaments, com imitar amb precisió algunes consonants o diferències de sons entre llengües, ofereix un pas prometedor cap a una comprensió més profunda del paper de la imitació vocal en la comunicació i l'evolució del llenguatge. El treball ressalta la interacció entre factors fisiològics, socials i comunicatius, amb implicacions per a futures tecnologies en música, art i més enllà.


Watch video about

MIT desenvolupa una IA per a la imitació vocal similar a la humana.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 24, 2025, 1:29 p.m.

Estudi de cas: Històries d'èxit en SEO impulsades…

Aquest estudi de cas explora els efectes transformadors de la Intel·ligència Artificial (IA) sobre les estratègies de optimització per a motors de cerca (SEO) en diferents empreses.

Dec. 24, 2025, 1:20 p.m.

El contingut de vídeos generat per IA guanya popu…

La intel·ligència artificial (IA) està revolucionant ràpidament el màrqueting, especialment a través de vídeos generats per IA que permeten a les marques connectar més profundament amb els seus públics mitjançant contingut altament personalitzat.

Dec. 24, 2025, 1:18 p.m.

Les 51 millors estadístiques de màrqueting amb IA…

La intel·ligència artificial (IA) està influenciant profundament moltes indústries, especialment el màrqueting.

Dec. 24, 2025, 1:16 p.m.

El SEO ben conegut explica per què els agents d’A…

.-Estic observant de ben a prop l’ascens de l’agentic SEO, convençut que a mesura que les capacitats de la IA progressin en els pròxims anys, els agents transformaran profundament la indústria.

Dec. 24, 2025, 1:16 p.m.

HTC aposta per la seva estratègia d'IA oberta per…

HTC, amb seu seu a base de Taiwan, aposta per l’enfocament de plataforma oberta per guanyar quota de mercat en el sector dels ulleres intel·ligents en ràpid creixement, ja que la seva nova gafa amb intel·ligència artificial permet als usuaris triar quin model d’IA utilitzar, segons un directiu.

Dec. 24, 2025, 1:14 p.m.

Predicció: Aquestes 3 accions d'Intel·ligència Ar…

Les accions d’intel·ligència artificial (IA) van continuar el seu fort rendiment al 2025, consolidant els guanys del 2024.

Dec. 24, 2025, 9:26 a.m.

Intel·ligència artificial en l'anàlisi de vídeo: …

En els darrers anys, un nombre creixent d’indústries han adoptat l’anàlisi de vídeo basada en intel·ligència artificial com a mitjà potent per extreure informació valuosa de grans conjunts de dades visuals.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today