News
>
Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Nov. 24, 2024, 8:29 p.m.

Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Brief news summary

Lideri industrije u AI ponovo razmatraju snažnu oslanjenost na velike skupove podataka za treniranje jezičkih modela. Kompanije poput OpenAI, Meta i Google tradicionalno su verovale da više podataka poboljšava performanse, posebno sa transformer arhitekturama. Međutim, raste zabrinutost da ova strategija može donositi sve manje koristi, što podstiče istraživanje alternativnih metoda. Aleksandr Vang iz Scale AI ističe probleme s preteranim fokusiranjem na zakone skaliranja. Aidan Gomez, izvršni direktor Cohere-a, kritikuje neefikasnost trenutnog pristupa, zalažući se za manje, isplativije modele. Neki stručnjaci sumnjaju da postojeće tehnike mogu postići veštačku opštu inteligenciju. Richard Socher predlaže nov način poboljšanja preciznosti modela transformisanjem pitanja u kod. Uprkos zabrinutostima, neki ostaju optimistični u vezi sa skaliranjem. Glavni tehnološki direktor Microsofta, Kevin Scott, nudi drugačiju perspektivu, a OpenAI nastavlja da inovira. U septembru je OpenAI predstavio model o1, koji je izvanredan u kvantitativnim zadacima i nadmašuje ChatGPT. Prema Waleedu Kadousu, dok GPT-4 pruža brze odgovore, model o1 pruža dublju analizu, nudeći korisnicima bolje interpretativne sposobnosti.

Lideri u oblasti veštačke inteligencije preispituju metode obuke velikih jezičkih modela koji zavise od velikih količina podataka, jer se tradicionalni modeli, koji linearno skaliraju s podacima, možda približavaju svojim granicama. Industrija sada podržava manje, efikasnije modele i inovativne metode obuke. Godinama su kompanije poput OpenAI, Meta i Googlea prikupljale ogromne baze podataka, verujući da više podataka rezultira pametnijim modelima. Međutim, konvencionalna mudrost se preispituje. Istraživanja ukazuju na to da transformatori, neuronske mreže iza ovih modela, skaliraju u skladu sa podacima i računalnom snagom koju dobijaju. Aleks Voika, konsultant na Univerzitetu Mohamed bin Zayed za veštačku inteligenciju, objasnio je da tradicionalni modeli transformatora slede ovu linearnu vezu. Ali rukovodioci počinju da uviđaju ograničenja ovog pristupa i istražuju nove načine za unapređenje tehnologije. Velike investicije u veštačku inteligenciju oslanjale su se na verovanje da će se ovo skaliranje nastaviti, a Aleksandr Vang, direktor Scale AI-a, opisuje to kao "najveće pitanje u industriji".

Neki tvrde da je trenutna metoda pojednostavljena; Aidan Gomez, direktor Cohere-a, tvrdi da je prosto povećanje veličine modela i računalne moći i najpouzdaniji i najmanje inovativan način unapređenja modela. Gomez promoviše manje, troškovno-efikasne modele, prikupljajući podršku industrije. Međutim, i dalje postoje zabrinutosti da ovaj pristup možda neće postići veštačku opštu inteligenciju, oblik AI-a sposoban za inteligenciju na nivou čoveka, što je cilj najvećih AI kompanija. Veliki jezički modeli obučeni su da "predviđaju sledeći token" u sekvenci, kako objašnjava Ričard Sočer, direktor You. com-a. On predlaže poboljšanje modela tako što će ih naučiti da pretvaraju pitanja u kod, čime se smanjuju greške i unapređuju sposobnosti. Nisu svi lideri saglasni da je AI dostigla zid. Tehnički direktor Microsofta Kevin Skot tvrdi da skaliranje i dalje donosi rezultate, uprkos nekim verovanjima u industriji. OpenAI, na primer, nastoji da unapredi postojeće modele poput o1, koji je objavljen u septembru, a koji i dalje koristi tehnike predviđanja, ali je specijalizovan za kvantitativne zadatke poput kodiranja i matematike. Razlika između o1 i ChatGPT je u o1-ovom poboljšanom vremenu obrade za generisanje odgovora. Valid Kadous, bivši inženjerski rukovodilac, poredi GPT-4 s pričljivim prijateljem koji daje mnogo ideja, dok je o1 kao pažljiv prijatelj koji pruža sažete, precizne odgovore.

News source

Watch video about

Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Nvidia otkriva novi generacijski AI čipset koji će revolucionirati igraće konzole

SkyReels V3: Napredni višemodalni AI paket za besprekorno stvaranje videa, slika i digitalnih ljudi

Anyplace Real Estate prijavljuje snažnu zaradu u trećem kvartalu, napreduje u integraciji veštačke inteligencije i spajanju sa Compass-om

The Best for your Business

Hot news

Nvidia-ov AI čip pokreće konzole sleće generacije…

Нови SkyReels званично лансиран

Bilo gde se fokusira na rast, dok se spajanje AI …

Preispitivanje YouTube SEO: Osvojiti vidljivost u…

Vista Social uvodi ChatGPT tehnologiju, postajući…

Ove 4 AI akcije će ove nedelje promeniti tržište …

Palantir prikazuje zabrinutost oko procene vredno…

AI Company

Sales

Marketing

Preispitivanje podataka intenzivnog treniranja: Budućnost AI modela

Brief news summary

News source

Watch video about

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator. Let’s make a post or video and publish it on any social media — ready?

Content Maker

Last news

Nvidia otkriva novi generacijski AI čipset koji će revolucionirati igraće konzole

SkyReels V3: Napredni višemodalni AI paket za besprekorno stvaranje videa, slika i digitalnih ljudi

Anyplace Real Estate prijavljuje snažnu zaradu u trećem kvartalu, napreduje u integraciji veštačke inteligencije i spajanju sa Compass-om

The Best for your Business

Hot news

Nvidia-ov AI čip pokreće konzole sleće generacije…

Нови SkyReels званично лансиран

Bilo gde se fokusira na rast, dok se spajanje AI …

Preispitivanje YouTube SEO: Osvojiti vidljivost u…

Vista Social uvodi ChatGPT tehnologiju, postajući…

Ove 4 AI akcije će ove nedelje promeniti tržište …

Palantir prikazuje zabrinutost oko procene vredno…

AI Company

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Check your email

Launch Your AI-Powered Business

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?