lang icon English
Nov. 24, 2024, 8:29 p.m.
1811

Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Brief news summary

Lideri industrije u AI ponovo razmatraju snažnu oslanjenost na velike skupove podataka za treniranje jezičkih modela. Kompanije poput OpenAI, Meta i Google tradicionalno su verovale da više podataka poboljšava performanse, posebno sa transformer arhitekturama. Međutim, raste zabrinutost da ova strategija može donositi sve manje koristi, što podstiče istraživanje alternativnih metoda. Aleksandr Vang iz Scale AI ističe probleme s preteranim fokusiranjem na zakone skaliranja. Aidan Gomez, izvršni direktor Cohere-a, kritikuje neefikasnost trenutnog pristupa, zalažući se za manje, isplativije modele. Neki stručnjaci sumnjaju da postojeće tehnike mogu postići veštačku opštu inteligenciju. Richard Socher predlaže nov način poboljšanja preciznosti modela transformisanjem pitanja u kod. Uprkos zabrinutostima, neki ostaju optimistični u vezi sa skaliranjem. Glavni tehnološki direktor Microsofta, Kevin Scott, nudi drugačiju perspektivu, a OpenAI nastavlja da inovira. U septembru je OpenAI predstavio model o1, koji je izvanredan u kvantitativnim zadacima i nadmašuje ChatGPT. Prema Waleedu Kadousu, dok GPT-4 pruža brze odgovore, model o1 pruža dublju analizu, nudeći korisnicima bolje interpretativne sposobnosti.

Lideri u oblasti veštačke inteligencije preispituju metode obuke velikih jezičkih modela koji zavise od velikih količina podataka, jer se tradicionalni modeli, koji linearno skaliraju s podacima, možda približavaju svojim granicama. Industrija sada podržava manje, efikasnije modele i inovativne metode obuke. Godinama su kompanije poput OpenAI, Meta i Googlea prikupljale ogromne baze podataka, verujući da više podataka rezultira pametnijim modelima. Međutim, konvencionalna mudrost se preispituje. Istraživanja ukazuju na to da transformatori, neuronske mreže iza ovih modela, skaliraju u skladu sa podacima i računalnom snagom koju dobijaju. Aleks Voika, konsultant na Univerzitetu Mohamed bin Zayed za veštačku inteligenciju, objasnio je da tradicionalni modeli transformatora slede ovu linearnu vezu. Ali rukovodioci počinju da uviđaju ograničenja ovog pristupa i istražuju nove načine za unapređenje tehnologije. Velike investicije u veštačku inteligenciju oslanjale su se na verovanje da će se ovo skaliranje nastaviti, a Aleksandr Vang, direktor Scale AI-a, opisuje to kao "najveće pitanje u industriji".

Neki tvrde da je trenutna metoda pojednostavljena; Aidan Gomez, direktor Cohere-a, tvrdi da je prosto povećanje veličine modela i računalne moći i najpouzdaniji i najmanje inovativan način unapređenja modela. Gomez promoviše manje, troškovno-efikasne modele, prikupljajući podršku industrije. Međutim, i dalje postoje zabrinutosti da ovaj pristup možda neće postići veštačku opštu inteligenciju, oblik AI-a sposoban za inteligenciju na nivou čoveka, što je cilj najvećih AI kompanija. Veliki jezički modeli obučeni su da "predviđaju sledeći token" u sekvenci, kako objašnjava Ričard Sočer, direktor You. com-a. On predlaže poboljšanje modela tako što će ih naučiti da pretvaraju pitanja u kod, čime se smanjuju greške i unapređuju sposobnosti. Nisu svi lideri saglasni da je AI dostigla zid. Tehnički direktor Microsofta Kevin Skot tvrdi da skaliranje i dalje donosi rezultate, uprkos nekim verovanjima u industriji. OpenAI, na primer, nastoji da unapredi postojeće modele poput o1, koji je objavljen u septembru, a koji i dalje koristi tehnike predviđanja, ali je specijalizovan za kvantitativne zadatke poput kodiranja i matematike. Razlika između o1 i ChatGPT je u o1-ovom poboljšanom vremenu obrade za generisanje odgovora. Valid Kadous, bivši inženjerski rukovodilac, poredi GPT-4 s pričljivim prijateljem koji daje mnogo ideja, dok je o1 kao pažljiv prijatelj koji pruža sažete, precizne odgovore.


Watch video about

Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 4, 2025, 1:22 p.m.

Nvidia-ov AI čip pokreće konzole sleće generacije…

Nvidia je predstavio svoj najnoviji AI čipset, koji će postati osnovni deo next-gen gejming konzola.

Nov. 4, 2025, 1:18 p.m.

Нови SkyReels званично лансиран

Objašnjenje o pristupačnosti Navigacija preskočiti SkyReels integriše vodeće multimodalne KI- modele kao što su Google VEO 3

Nov. 4, 2025, 1:17 p.m.

Bilo gde se fokusira na rast, dok se spajanje AI …

Anywhere Real Estate zaključio je godinu punu vesti sa kratkim izvještajem o zaradama za treći kvartal koji je pokazao snažan zamah i razvoj u oblasti veštačke inteligencije, dok se priprema za buduću integraciju sa Compass-om.

Nov. 4, 2025, 1:13 p.m.

Preispitivanje YouTube SEO: Osvojiti vidljivost u…

Pregledi veštačke inteligencije su najnoviji trend u SEO svetu, pri čemu smatrano citiranje ovih sažetaka na Google-u ključnim merilom uspeha u SEO-u.

Nov. 4, 2025, 1:09 p.m.

Vista Social uvodi ChatGPT tehnologiju, postajući…

Vista Social je predstavio značajno unapređenje u upravljanju društvenim mrežama integracijom ChatGPT tehnologije u svoju platformu, čime je postao prvi alat koji uključuje naprednu konverzacionu veštačku inteligenciju kompanije OpenAI.

Nov. 4, 2025, 1:09 p.m.

Ove 4 AI akcije će ove nedelje promeniti tržište …

U današnjem videu pokrivam najnoviji razvoj događaja koji utiču na Astera Labs (ALAB 3,17%), Super Micro Computer (SMCI 4,93%) i razne druge akcije povezane sa veštačkom inteligencijom.

Nov. 4, 2025, 9:30 a.m.

Palantir prikazuje zabrinutost oko procene vredno…

Palantir Technologies Inc.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today