lang icon English
Sept. 20, 2024, 3:09 a.m.
1135

Генератор на идеи со AI ги надминува човечките научници во оригиналност

Brief news summary

Нов преглед на arXiv го претставува Claude 3.5, AI алатка која успеала во генерирањето оригинални истражувачки идеи, надминувајќи група од 50 научници. Иако излезите на AI добија пофалби за иновации, рецензентите изразуваат загриженост за нивната практичност. Едногодишната студија вклучуваше над 100 истражувачи, со 49 мотивирани да произведат идеи брзо, додека Claude генерираше илјадници од постоечката академска литература. Иако многу од сугестиите на Claude беа сметани за пооригинални, само неколку беа препознаени како вистински иновативни, што предизвика некое незадоволство меѓу човечките учесници. Критичарите посочија методолошки недостатоци, особено уредувањето на двете, AI и човечките идеи преку јазичен модел, што може да влијае на оценувањето на оригиналноста. Идните истражувања ќе се насочат на споредба на овие резултати со водечки конференциски трудови, фокусирајќи се на ефективноста на јазичните модели наспроти човечката креативност во генерирањето истражувачки концепти.

Генератор кој користи AI за идеи, надминува 50 независни научници во генерирање на оригинални истражувачки концепти, според нов преглед на arXiv. Додека рецензентите ги оценувале идеите на AI како поинтересни од оние на луѓето, AI сугестиите биле малку помалку изводливи. Сепак, експертите предупредуваат дека студијата, која не е подвргната на рецензија, има ограничувања, главно затоа што се фокусирала на едно истражувачко подрачје и од учесниците се барало да произведат идеи во ограничено време, што можеби не го претставува нивното најдобро дело. Постојано расте интересот за тоа како големи јазични модели (LLM), како оние зад ChatGPT, можат да помогнат во истражувачки задачи како што се пишувањето и прегледувањето на литературата. Евалуацијата на идеи генерирани од AI наспроти човечки идеи е предизвик поради субјективната природа на оценувањето на идеите и потребата од експертни рецензенти. Коавторот на студијата, Ченглеи Си, нагласува дека директната споредба е потребна за да се контекстуализираат способностите на AI. Проектот вклучуваше над 100 истражувачи специјализирани за природна јазична обработка, со 49 учесници кои генерираа идеи на одредени теми во текот на десет дена, со финансиска награда како мотив. Истовремено, истражувачите го користеа Claude 3. 5 LLM, кој генерираше околу 4, 000 идеи на истите теми, рангирајќи ги најоригиналните. Во оценувањето, 79 рецензенти ги оценуваа идеите според новина, возбудливост, изводливост и ефективност.

За да се елиминира пристрасноста, LLM го стандардизираше прикажувањето на идеите генерирани од AI и човечките идеи. Во просек, идеите на AI добиле повисоки оценки за оригиналност и возбудливост; меѓутоа, длабинската анализа покажа дека само околу 200 од 4, 000 AI идеи биле навистина уникатни. Многу човечки учесници признаваат дека нивните поднесоци биле само просечни во споредба со нивната претходна работа. Студијата сугерира дека иако LLM може да генерира донекаде оригинални идеи во споредба со постоечката литература, дали тие можат да ја надминат револуционерната човечка мисла останува неизвесно. Дополнително, споредбата вклучувала уредени поднесоци кои можат да влијаат на перцепциите на новина. Џевин Вест од Универзитетот во Вашингтон ја нагласува важноста на фер споредби, посочувајќи дека брзите способности за генерирање идеи на AI можат да ги искриват резултатите наспроти човечките способности. Во иднина, Си и неговиот тим планираат да ги споредат идеите генерирани од AI со врвни конференциски трудови за подобро да ја оценат ефективноста на LLM во однос на човечката креативност. Нивната цел е да поттикнат подлабоко разгледување на улогата на AI во истражувачкиот процес во иднина.


Watch video about

Генератор на идеи со AI ги надминува човечките научници во оригиналност

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 4, 2025, 1:22 p.m.

Нивидијиниот AI чипсет го подигнува следната гене…

Нвидиа ги претстави своите најнови АИ чипсети, кои ќе стане основен дел од идните генерации на игри конзоли.

Nov. 4, 2025, 1:18 p.m.

Новиот SkyReels официјално се лансира

Објаснување за пристапноста Навигација прегуглување SkyReels интегрира водечки мулти-модални KI-модели како Google VEO 3

Nov. 4, 2025, 1:17 p.m.

Се фокусира на раст, искусната интелигенција како…

Anywhere Real Estate ја заклучи годината полна со вести со кратко извештај за приходите од третот квартал кој ја потенцира силната динамика и развојот во областта на вештачката интелигенција, додека се подготвува за идната интеграција со Compass.

Nov. 4, 2025, 1:13 p.m.

Преиспитување на SEO за YouTube: Постигнување на …

Прегледите за ИИ се најновиот вжештен тренд во SEO, при што цитирањето на овие резуми на Гугл се смета за клучна мерка за успех во SEO.

Nov. 4, 2025, 1:09 p.m.

Vista Social ја воведува технологијата ChatGPT, с…

Vista Social воведе значаен напредок во управувањето со социјалните мрежи со интеграција на технологијата ChatGPT во својата платформа, станувајќи првиот алат кој ја вклучува напредната разговорна вештачка интелигенција на OpenAI.

Nov. 4, 2025, 1:09 p.m.

Овие 4 акции на АИ ќе ја променија пазарот на АИ …

Во денешното видео ги покривам најновите случувања кои влијаат врз Astera Labs (ALAB 3,17%), Super Micro Computer (SMCI 4,93%) и различни други акции поврзани со вештачка интелигенција.

Nov. 4, 2025, 9:30 a.m.

Палантир презентира за загриженоста околу процена…

Палантир Технологии Инк.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today