lang icon En
Sept. 20, 2024, 3:09 a.m.
1531

AI-knúinn hugmyndaframleiðandi skarar fram úr mannlegu vísindamanni í upprunaleika

Brief news summary

Nýleg preprint á arXiv kynnir Claude 3.5, AI tól sem stóð sig betur í að framleiða upprunalegar rannsóknarhugmyndir, umfram hóp 50 vísindamanna. Þó að AI útborganirnar hafi fengið lof fyrir nýsköpun, höfðu matsmenn áhyggjur af framkvæmdarhæfni þeirra. Árslang rannsókn innihélt yfir 100 vísindamenn, með 49 hvattanir til að framleiða hugmyndir hratt, á meðan Claude framleiddi þúsundir út frá núverandi fræðilegum heimildum. Þó að margar af tillögum Claude hafi verið taldar nýstárlegar voru aðeins fáar viðurkenndar sem sannarlega nýsköpunarviðburðir, sem leiddi til nokkurs óánægju meðal mannlegra þátttakenda. Gagnrýnendur bentu á aðferðafræðilega galla, sérstaklega ritstýringu bæði AI og mannlegra hugmynda í gegnum tungumálamódel, sem gæti haft áhrif á mat á nýsköpun. Fyrirhugaðar rannsóknir munu reyna að bera saman þessar niðurstöður við leiðandi ráðstefnuritgerðir, með áherslu á virkni tungumálamódela í samanburði við mannlega sköpunargáfu við framleiðslu rannsóknarhugmynda.

Samkvæmt nýlegum preprint á arXiv stóð AI-knúinn hugmyndaframleiðandi sig betur en 50 sjálfstæðir vísindamenn í að framleiða upprunalegar rannsóknarhugmyndir. Þó að matsmenn hafi gefið hugmyndum AI hærri einkunn fyrir spennu en þeim frá mönnum, voru AI tillögur aðeins minna framkvæmanlegar. Hins vegar vara sérfræðingar við að óyfirfarinn rannsókn hafi takmarkanir, aðallega vegna þess að hún beindist að einu rannsóknarsviði og krafðist þess að þátttakendur framleiddu hugmyndir undir tímaskorti, sem gæti ekki endurspeglað bestu vinnu þeirra. Það er vaxandi áhugi á því hvernig stór tungumálamódel (LLM) eins og þau sem eru að baki ChatGPT, geta aðstoðað við rannsóknir eins og skrif og bókmenntagreiningu. Mat á hugmyndum frá AI samanborið við mannlegar hugmyndir er erfitt vegna huglægs eðlis hugmyndamats og þörf fyrir sérfræðinga. Rannsóknarhöfundurinn Chenglei Si leggur áherslu á að bein samanburður sé nauðsynlegur til að setja AI getu í samhengi. Verkefnið innihélt yfir 100 vísindamenn sem sérhæfa sig í náttúrumálavinnslu, með 49 þátttakendur sem framleiddu hugmyndir um sérstök efni í tíu daga, hvattir með peningagreiðslum. Á sama tíma notuðu vísindamennirnir Claude 3. 5 LLM, sem framleiddi um 4000 hugmyndir um sömu efni og raðaði þeim eftir upprunaleika. Í matsferlinu mátu 79 matsmenn hugmyndirnar út frá nýbreytni, spennu, framkvæmanleika og áhrifum.

Til að útrýma slagsíðu staðlaði LLM framsetningu bæði AI og mannframleiddra hugmynda. Að meðaltali fengu AI hugmyndir hærri einkunn fyrir upprunaleika og spennu; hins vegar leiddi ítarleg greining í ljós að aðeins um 200 af 4000 AI hugmyndum voru sannarlega einstakar. Margir mannlegar þátttakendur viðurkenndu að innsendingar þeirra væru aðeins meðalmeðaltal samanborið við fyrri vinnu. Rannsóknin bendir til þess að á meðan LLM geti framleitt nokkur nýstárlega hugmyndir samanborið við núverandi bókmenntir, sé ekki ljóst hvort þær geti farið fram yfir mannshugann sem brýtur ísinn. Að auki var samanburðurinn á ritgerðarbreyttum innsendingum sem gætu hafa haft áhrif á skynjun á nýbreytni. Jevin West frá Háskólanum í Washington undirstrikar mikilvægi réttláts samanburðar og bendir á að hröð hugmyndaframleiðsla AI gæti skekkt niðurstöður gegn mannlegri getu. Í framtíðinni áætlar Si og teymi hans að bera saman AI framleiddar hugmyndir við efstu ráðstefnuritgerðir til að meta betur virkni LLM samanborið við mannlegt sköpunargáfu. Þeir stefna að því að hvetja til dýpri umhugsunar um hlutverk AI í rannsóknarferlinu í framtíðinni.


Watch video about

AI-knúinn hugmyndaframleiðandi skarar fram úr mannlegu vísindamanni í upprunaleika

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 22, 2025, 9:22 a.m.

OpenAI sér betri hagnaðarmörk í viðskiptum, segir…

útgáfan hélt því fram að fyrirtækið hefði aukið „útreikningsávöxtun“ sitt, sem er innra mælikvarði sem táknar hluta af tekjum sem eftir stendur eftir að hafa greitt fyrir rekstrarferla fyrir greiðandi viðskiptavini fyrirtækisins í fyrirtækja- og neytendavörum.

Dec. 22, 2025, 9:19 a.m.

Vélavélar fyrir myndbandsgreiningu gera mögulegt …

Í hröðum þróunarmða sviði stafræns markaðssetningar leikur gervigreind (AI) lykilhlutverk í endurmótun á tengslum merkjanna við áhorfendur sína.

Dec. 22, 2025, 9:15 a.m.

Nýta gervigreind fyrir leitarvélabotun: Bestu ráð…

Þegar gervigreind (GV) þróast eykst áhrif hennar á leitarvélabætingu (LVB) verulega.

Dec. 22, 2025, 9:14 a.m.

Að túlka áhrif gervigreindar á auglýsingar og mar…

Vélmenni (AI) er grundvallarbreytandi í auglýsinga- og markaðsgeiranum, sem markar djúpa umbreytingu sem fer langt yfir áður tíðkar tækniframfarir.

Dec. 22, 2025, 9:12 a.m.

Nvidia: Aðeins 3%提供đjiðjum hæstu fyrirtæki í gerv…

Nvidia: Aðeins 3% álag fyrir mikilvægasta AI fyrirtækið The J-kenningin 1,32 þús

Dec. 22, 2025, 5:21 a.m.

„AI SMM“, nýtt námskeið frá Hallakate – Lærðu að …

Á tímum þar sem tækni breytir hvernig við býrjum til efni og stýrum samfélagsnetum kynntum við nýja þjálfun sem hentar nýja tímabilinu: AI SMM.

Dec. 22, 2025, 5:19 a.m.

Stærð markaðar fyrir sölu á AI þjálfunar GPU klös…

Yfirlit skýrslu Markaður fyrir sölu á GPU-klessum fyrir alþjóðlega AI þjálfunartæki er spáð að ná að rúmlega 87,5 milljörðum bandaríkjadala árið 2035, upp úr 18,2 milljörðum árið 2025, vaxandi með árlegu vexti (CAGR) um 17,0% milli áranna 2026 og 2035

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today