lang icon English
Nov. 24, 2024, 8:29 p.m.
1851

Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Brief news summary

Tehisintellekti (AI) valdkonna liidrid kaaluvad uuesti suurtel andmekogumitel põhinevat lähenemist keelemudelite treenimisel. Ettevõtted nagu OpenAI, Meta ja Google on traditsiooniliselt uskunud, et rohkem andmeid parandab jõudlust, eriti transformaatormudelite arhitektuuride puhul. Kuid mure kasvab, et see strateegia võib tuua vähenenevat tulu, mis innustab alternatiivsete meetodite uurimist. Alexandr Wang Scale AI-st toob esile probleeme, mis tekivad liigsest keskendumisest skaleerimisseadustele. Cohere'i tegevjuht Aidan Gomez kritiseerib praeguse lähenemise ebaefektiivsust, soovitades väiksemaid ja kuluefektiivsemaid mudeleid. Mõned eksperdid kahtlevad, kas olemasolevad tehnikad suudavad saavutada tehisüldintelligentsust. Richard Socher teeb ettepaneku uudse meetodi kohta, mille abil võiks mudelite täpsust parandada, muutes küsimused koodiks. Hoolimata muredest jäävad mõned skaleerimise suhtes optimistlikuks. Microsofti tehnoloogiajuht Kevin Scott pakub teistsugust vaatenurka ning OpenAI jätkab uuendustega. Septembris tutvustas OpenAI o1 mudelit, mis paistab silma kvantitatiivsetes ülesannetes ja ületab ChatGPT. Waleed Kadous märgib, et kuigi GPT-4 vastab kiirelt, pakub o1 mudel põhjalikumat analüüsi, andes kasutajatele paremad tõlgendamisvõimalused.

Tehisintellekti juhid hindavad uuesti üle andmemahukaid treeningmeetodeid suurekeelsete mudelite jaoks, kuna traditsioonilised mudelid, mis skaleeruvad lineaarse andmemahuga, võivad olla jõudnud oma piirideni. Tööstus toetab nüüd väiksemaid, tõhusamaid mudeleid ja uuenduslikke treeningmeetodeid. Aastaid on ettevõtted nagu OpenAI, Meta ja Google kogunud tohutuid andmekogumeid, eeldades, et rohkem andmeid toob kaasa targemad mudelid. Kuid see tavaline arusaam on ümber mõtestamisel. Uuringud viitavad sellele, et trafo mudelid, need närvivõrgud, mis asuvad nende mudelite taga, skaleeruvad vastavalt saadud andmetele ja arvutusvõimsusele. Alex Voica, konsultant Mohamed bin Zayed Tehisintellekti Ülikoolis, selgitas, et traditsioonilised trafo mudelid järgivad seda lineaarset seost. Ent juhid hakkavad selles lähenemisviisis piiranguid nägema ja uurivad uusi viise tehnoloogia edendamiseks. Suurte investeeringute tegemine tehisintellekti on sõltunud usust, et see skaleerimine jätkub, nagu kirjeldas Scale AI tegevjuht Alexandr Wang, nimetades seda tööstuse "suurimaks küsimuseks".

Mõned väidavad, et praegune meetod on liiga lihtsustatud; Aidan Gomez, Cohere tegevjuht, väidab, et lihtsalt mudelite suuruse ja arvutusvõimsuse suurendamine on nii kõige usaldusväärsem kui ka kõige vähem uuenduslik viis mudelite parandamiseks. Gomez propageerib väiksemaid, kulutõhusamaid mudeleid, saades tööstuses toetust. Ent siiski on muret, et see lähenemisviis ei pruugi saavutada üldkaupse tehisintellekti, tehisintellekti vormi, mis suudaks saavutada inimtasemel intelligentsuse, mille poole suured tehisintellekti ettevõtted püüdlevad. Suured keelemudelid on koolitatud järgmise "tähise" prognoosimiseks jadas, nagu selgitas Richard Socher, You. com tegevjuht. Ta soovitab mudeleid täiustada, muutes küsimused koodiks, et seeläbi vähendada vigu ja tõhustada võimekust. Mitte kõik juhid ei nõustu, et tehisintellekt on jõudnud tupikusse. Microsofti tehnoloogiajuht Kevin Scott väidab, et skaleerimine toob siiski kasu, vastupidiselt mõnele tööstuse uskumusele. Näiteks OpenAI on püüdnud täiustada olemasolevaid mudeleid, nagu o1, mis avaldati septembris ja kasutab endiselt ennustustehnikaid, kuid on spetsialiseerunud kvantitatiivsetele ülesannetele, nagu kodeerimine ja matemaatika. Erinevus o1 ja ChatGPT vahel seisneb o1 parendatud töötlemisajas vastuste genereerimisel. Waleed Kadous, endine insenerijuht, võrdleb GPT-4 jutuka sõbraga, kes pakub palju ideid, samas kui o1 sarnaneb mõtlikule sõbrale, kes edastab lühikesi, täpseid vastuseid.


Watch video about

Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 10, 2025, 9:34 a.m.

Tehisintellekti loodud uudistevideod: kahe teraga…

Viimastel aastatel on tehisintellekti (AI) kiire arengu tulemusena muutunud paljud igapäevaelu aspektid, sealhulgas uudiste tootmine ja tarbimine.

Nov. 10, 2025, 9:21 a.m.

OpenAI Püüdleb CHIPS-i seaduse maksukrediidi laie…

OpenAI on ametlikult kutsunud USA valitsust üles laiendama CHIPSÕigusaktis (CHIPS Act) väljaannete arengu toetava investeeringukrediidi (AMIC) hõlmamist ka infrastruktuuri, mis toetab tehisintellekti (AI), nagu serverid, andmekeskused ja jõuü have süsteemid.

Nov. 10, 2025, 9:18 a.m.

Rallyware tutvustab Intelligent Field Orchestrati…

Otsene müük on kriitilisel hetkel, ütles Rallyware tegevjuht George Elfond.

Nov. 10, 2025, 9:16 a.m.

tehisintellekti mõju digitaalse turunduse stratee…

Digitaalset turundusmaastikku iseloomustab sügav muutus, mida põhjustab kiire areng ja kasutuselevõtt tehisintellekti toel sisutuotmise tööriistadest nagu ChatGPT, ContentShake ja Typeface.

Nov. 10, 2025, 9:12 a.m.

Profound kogus 20 miljonit dollarit Series A voor…

Profound, innovaatiline tehnoloogiaettevõte, mis tegeleb tehisintellekti (AI) otsingumootorite optimeerimisega, on saanud 20 miljoni dollari suuruse Series A raha.

Nov. 10, 2025, 5:20 a.m.

News Corp suurendab tehisintellekti litsentseerim…

News Corp on avaldanud oma finantsaruanded 2026.

Nov. 10, 2025, 5:17 a.m.

Anthropic laiendab oma Euroopa kohalolekut uute k…

Anthropic, juhtiv Ameerika Ühendriikides asuv tehisintellekti startup, mille asutasid 2021.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today