News
>
Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Nov. 24, 2024, 8:29 p.m.

Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Brief news summary

Tehisintellekti (AI) valdkonna liidrid kaaluvad uuesti suurtel andmekogumitel põhinevat lähenemist keelemudelite treenimisel. Ettevõtted nagu OpenAI, Meta ja Google on traditsiooniliselt uskunud, et rohkem andmeid parandab jõudlust, eriti transformaatormudelite arhitektuuride puhul. Kuid mure kasvab, et see strateegia võib tuua vähenenevat tulu, mis innustab alternatiivsete meetodite uurimist. Alexandr Wang Scale AI-st toob esile probleeme, mis tekivad liigsest keskendumisest skaleerimisseadustele. Cohere'i tegevjuht Aidan Gomez kritiseerib praeguse lähenemise ebaefektiivsust, soovitades väiksemaid ja kuluefektiivsemaid mudeleid. Mõned eksperdid kahtlevad, kas olemasolevad tehnikad suudavad saavutada tehisüldintelligentsust. Richard Socher teeb ettepaneku uudse meetodi kohta, mille abil võiks mudelite täpsust parandada, muutes küsimused koodiks. Hoolimata muredest jäävad mõned skaleerimise suhtes optimistlikuks. Microsofti tehnoloogiajuht Kevin Scott pakub teistsugust vaatenurka ning OpenAI jätkab uuendustega. Septembris tutvustas OpenAI o1 mudelit, mis paistab silma kvantitatiivsetes ülesannetes ja ületab ChatGPT. Waleed Kadous märgib, et kuigi GPT-4 vastab kiirelt, pakub o1 mudel põhjalikumat analüüsi, andes kasutajatele paremad tõlgendamisvõimalused.

Tehisintellekti juhid hindavad uuesti üle andmemahukaid treeningmeetodeid suurekeelsete mudelite jaoks, kuna traditsioonilised mudelid, mis skaleeruvad lineaarse andmemahuga, võivad olla jõudnud oma piirideni. Tööstus toetab nüüd väiksemaid, tõhusamaid mudeleid ja uuenduslikke treeningmeetodeid. Aastaid on ettevõtted nagu OpenAI, Meta ja Google kogunud tohutuid andmekogumeid, eeldades, et rohkem andmeid toob kaasa targemad mudelid. Kuid see tavaline arusaam on ümber mõtestamisel. Uuringud viitavad sellele, et trafo mudelid, need närvivõrgud, mis asuvad nende mudelite taga, skaleeruvad vastavalt saadud andmetele ja arvutusvõimsusele. Alex Voica, konsultant Mohamed bin Zayed Tehisintellekti Ülikoolis, selgitas, et traditsioonilised trafo mudelid järgivad seda lineaarset seost. Ent juhid hakkavad selles lähenemisviisis piiranguid nägema ja uurivad uusi viise tehnoloogia edendamiseks. Suurte investeeringute tegemine tehisintellekti on sõltunud usust, et see skaleerimine jätkub, nagu kirjeldas Scale AI tegevjuht Alexandr Wang, nimetades seda tööstuse "suurimaks küsimuseks".

Mõned väidavad, et praegune meetod on liiga lihtsustatud; Aidan Gomez, Cohere tegevjuht, väidab, et lihtsalt mudelite suuruse ja arvutusvõimsuse suurendamine on nii kõige usaldusväärsem kui ka kõige vähem uuenduslik viis mudelite parandamiseks. Gomez propageerib väiksemaid, kulutõhusamaid mudeleid, saades tööstuses toetust. Ent siiski on muret, et see lähenemisviis ei pruugi saavutada üldkaupse tehisintellekti, tehisintellekti vormi, mis suudaks saavutada inimtasemel intelligentsuse, mille poole suured tehisintellekti ettevõtted püüdlevad. Suured keelemudelid on koolitatud järgmise "tähise" prognoosimiseks jadas, nagu selgitas Richard Socher, You. com tegevjuht. Ta soovitab mudeleid täiustada, muutes küsimused koodiks, et seeläbi vähendada vigu ja tõhustada võimekust. Mitte kõik juhid ei nõustu, et tehisintellekt on jõudnud tupikusse. Microsofti tehnoloogiajuht Kevin Scott väidab, et skaleerimine toob siiski kasu, vastupidiselt mõnele tööstuse uskumusele. Näiteks OpenAI on püüdnud täiustada olemasolevaid mudeleid, nagu o1, mis avaldati septembris ja kasutab endiselt ennustustehnikaid, kuid on spetsialiseerunud kvantitatiivsetele ülesannetele, nagu kodeerimine ja matemaatika. Erinevus o1 ja ChatGPT vahel seisneb o1 parendatud töötlemisajas vastuste genereerimisel. Waleed Kadous, endine insenerijuht, võrdleb GPT-4 jutuka sõbraga, kes pakub palju ideid, samas kui o1 sarnaneb mõtlikule sõbrale, kes edastab lühikesi, täpseid vastuseid.

News source

Watch video about

Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Tehisintellekti loodud uudisvideote mõju: eelised, riskid ja võitlus valeinformatsiooniga

OpenAI kutsub USA üles laiendama CHIPS-i seaduse maksukrediiti tehisintellekti infrastruktuuri investeeringute jaoks

Rallyware revolutsioneer otse müügi teekonnal tehisintellekti abil jõudluse toetamisel

The Best for your Business

Hot news

Tehisintellekti loodud uudistevideod: kahe teraga…

OpenAI Püüdleb CHIPS-i seaduse maksukrediidi laie…

Rallyware tutvustab Intelligent Field Orchestrati…

tehisintellekti mõju digitaalse turunduse stratee…

Profound kogus 20 miljonit dollarit Series A voor…

News Corp suurendab tehisintellekti litsentseerim…

Anthropic laiendab oma Euroopa kohalolekut uute k…

AI Company

Sales

Marketing

Andmete mahuka koolituse ümbermõtestamine: tehisintellekti mudelite tulevik

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Tehisintellekti loodud uudisvideote mõju: eelised, riskid ja võitlus valeinformatsiooniga

OpenAI kutsub USA üles laiendama CHIPS-i seaduse maksukrediiti tehisintellekti infrastruktuuri investeeringute jaoks

Rallyware revolutsioneer otse müügi teekonnal tehisintellekti abil jõudluse toetamisel

The Best for your Business

Hot news

Tehisintellekti loodud uudistevideod: kahe teraga…

OpenAI Püüdleb CHIPS-i seaduse maksukrediidi laie…

Rallyware tutvustab Intelligent Field Orchestrati…

tehisintellekti mõju digitaalse turunduse stratee…

Profound kogus 20 miljonit dollarit Series A voor…

News Corp suurendab tehisintellekti litsentseerim…

Anthropic laiendab oma Euroopa kohalolekut uute k…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?