Генератор на идеи, захранван от AI, превъзхожда човешките учени по оригиналност

Според скорошен препринт на arXiv, генератор на оригинални идеи, захранван от AI, е превъзхождащ 50 независими учени в генерирането на оригинални изследователски концепции. Въпреки че рецензентите оцениха идеите на AI като по-вълнуващи от тези на хората, предложенията на AI бяха малко по-малко осъществими. Въпреки това, експертите предупреждават, че изследването, което не е рецензирано, има ограничения, главно защото се фокусира върху една изследователска област и изисква от участниците да генерират идеи под времеви ограничения, което може да не представлява тяхната най-добра работа. Има нарастващ интерес към това как големите езикови модели (LLMs), като тези зад ChatGPT, могат да подпомагат в изследователски задачи като писане и преглед на литература. Оценяването на идеи, генерирани от AI, спрямо човешки идеи е предизвикателство поради субективната природа на оценката на идеи и необходимостта от експертни оценители. Съавторът на изследването, Ченглей Си, подчертава, че директното сравнение е съществено за контекстуализиране на възможностите на AI. Проектът включва повече от 100 изследователи, специализиращи в обработка на естествен език, с 49 участници, които генерираха идеи по специфични теми през десет дни, стимулирани с парични награди. Едновременно с това изследователите използваха Claude 3. 5 LLM, който генерира около 4, 000 идеи по същите теми, като класира най-оригиналните. При оценяването 79 рецензенти оцениха идеите по оригиналност, вълнение, осъществимост и ефективност.
За да се елиминира пристрастие, един LLM стандартизира представянето на както AI-генерираните идеи, така и човешките идеи. Средно, идеите на AI получиха по-високи оценки за оригиналност и вълнение; въпреки това, дълбокият анализ разкри, че само около 200 от 4, 000 AI идеи са наистина уникални. Много човешки участници признаха, че техните предложения са средни в сравнение с предишната им работа. Изследването показва, че въпреки че LLMs могат да генерират до известна степен оригинални идеи в сравнение с наличната литература, все още е несигурно дали те могат да превъзхождат революционната човешка мисъл. Освен това, сравнението включваше редактирани предложения, които могат да са повлияли върху възприятията за оригиналност. Джефин Уест от Университета на Вашингтон подчертава важността на справедливи сравнения, посочвайки, че бързите способности на AI за генериране на идеи биха могли да изкривят резултатите срещу човешките способности. Напред Си и неговият екип планират да сравнят AI-генерираните идеи с най-добрите конференционни статии, за да оценят по-добре ефективността на LLMs относно човешката креативност. Те целят да насърчат по-задълбочено обмисляне на ролята на AI в изследователския процес в бъдеще.
Brief news summary
Скорошен препринт на arXiv представя Claude 3.5, инструмент за AI, който превъзхожда група от 50 учени в генерирането на оригинални изследователски идеи. Въпреки че производствата на AI получиха похвали за иновации, рецензентите изразиха опасения относно тяхната практическа осъществимост. Годишното изследване включваше над 100 изследователи, с 49 стимулирани за бързо създаване на идеи, докато Claude генерира хиляди от наличната академична литература. Въпреки че много от предложенията на Claude се смятаха за по-оригинални, само няколко се признаха за наистина иновативни, предизвиквайки известно недоволство сред човешките участници. Критиците посочиха методологични недостатъци, най-вече редактирането както на AI, така и на човешките идеи чрез езиков модел, което би могло да повлияе оценките за оригиналност. Предстоящите изследвания ще целят да сравнят тези резултати с водещи конференционни статии, фокусирайки се върху ефективността на езиковите модели спрямо човешката креативност в генерирането на изследователски концепции.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Перклексити си партнира с PayPal за пазаруване в …
Перплексицията задълбочава фокуса си върху пазаруване чрез чат, за да се отличи в конкурентната сфера на генеративния ИИ, заедно с OpenAI, Anthropic и Google.

Член на борда на Ripple твърди, че блокчейнът раз…
Ашиеш Бирла, член на борда на блокчейн компанията Ripple, изрази мнението, че технологията блокчейн всъщност "разделя" традиционните банки.

Саудитска Арабия иска да изгради бъдещето си след…
© 2025 Fortune Media IP Limited.

Circle пуска USDC и родния CCTP V2 на блокчейна S…
Circle, издателят на стабилната монета USD Coin (USDC), обяви, че нативният USDC вече е достъпен на блокчейна Sonic след завършването на обновлението с преминаване към нативна версия за USDC и CCTP V2.

Audible ще използва технология с изкуствен интеле…
Audible има планове да предложи „край до край“ технология за производство на ИИ – включително превод и гласове за разказ – на издатели за създаване на аудиокниги.

Пазарът на NFT-и претърпя значителен растеж на фо…
Пазарът на Не-фунгибелни Токени (NFT) изпитва значителен растеж и бележи началото на ера на трансформация за цифровото собственост и индустрията на изкуството.

Гугъл тества AI търсене на началната си страница
Надежната търсачка на Google сега има нов спътник: режим AI.