lang icon En
Sept. 20, 2024, 3:09 a.m.
1879

Генератор ідей на основі ШІ перевершує людських науковців в оригінальності

Brief news summary

Нещодавно опублікований препринт на arXiv представляє Claude 3.5, інструмент ШІ, який досяг успіху у створенні оригінальних дослідницьких ідей, перевершивши групу з 50 науковців. Хоча результати ШІ отримали похвалу за інноваційність, рецензенти висловили занепокоєння щодо їхньої практичної здійсненості. Дослідження тривало рік і залучило понад 100 дослідників, з яких 49 були стимульовані до швидкого генерування ідей, тоді як Claude генерував тисячі ідей з існуючої академічної літератури. Хоча багато пропозицій Claude були визнані більш оригінальними, лише деякі були справді новаторськими, викликаючи певне незадоволення серед людських учасників. Критики вказали на методологічні недоліки, особливо на редагування як ідей ШІ, так і людських через мовну модель, що могло вплинути на оцінку оригінальності. Майбутні дослідження зосередяться на порівнянні цих результатів з провідними конференційними роботами, приділяючи увагу ефективності мовних моделей порівняно з людською креативністю у створенні дослідницьких концепцій.

Згідно з нещодавно опублікованим препринтом на arXiv, генератор ідей на основі штучного інтелекту перевершив 50 незалежних науковців у створенні оригінальних дослідницьких концепцій. Хоча рецензенти оцінювали ідеї ШІ як більш захоплюючі, ніж ідеї людей, пропозиції ШІ були трохи менш здійсненними. Однак експерти застерігають, що дослідження має обмеження, головним чином через те, що воно зосереджувалося на одній галузі досліджень і вимагало від учасників генерувати ідеї в умовах обмеженого часу, що може не відображати їх найкращі роботи. Зростає інтерес до того, як великі мовні моделі (LLM), такі як ті, що лежать в основі ChatGPT, можуть допомогти в дослідницьких завданнях, таких як написання та огляд літератури. Оцінка ідей, створених ШІ, порівняно з людськими ідеями, є складною через суб’єктивну природу оцінки ідей та необхідність експертних оцінювачів. Співавтор дослідження Ченлей Си наголошує, що пряме порівняння є важливим для контекстуалізації можливостей ШІ. Проект залучив понад 100 дослідників, які спеціалізуються на обробці природної мови, причому 49 з них генерували ідеї з конкретних тем протягом десяти днів, стимулюючись матеріальними винагородами. Одночасно дослідники використовували Claude 3. 5 LLM, який згенерував близько 4000 ідей з тих самих тем, ранжуючи найбільш оригінальні. В оцінці 79 рецензентів оцінювали ідеї за новизною, захоплюючістю, здійсненістю та ефективністю.

Щоб усунути упередженість, LLM стандартизував подачу як ідей, створених ШІ, так і людей. В середньому ідеї ШІ отримували вищі бали за оригінальність і захоплюючість; проте глибокий аналіз виявив лише близько 200 з 4000 ідей ШІ як дійсно унікальні. Багато людських учасників визнали, що їхні подання були лише середніми порівняно з попередніми роботами. Дослідження припускає, що хоча LLM можуть генерувати дещо оригінальні ідеї порівняно з існуючою літературою, чи можуть вони перевершити передові людські думки, залишається невизначеним. Крім того, порівняння включало відредаговані подання, що могло вплинути на сприйняття новизни. Джевін Вест з Вашингтонського університету підкреслює важливість справедливих порівнянь, зазначаючи, що швидкі можливості генерації ідей ШІ можуть спотворити результати на шкоду людським можливостям. На майбутнє Сі та його команда планують порівняти ідеї, створені штучним інтелектом, з найкращими конференційними роботами, щоб краще оцінити ефективність LLM порівняно з людською креативністю. Вони прагнуть заохотити глибший розгляд ролі ШІ в дослідницькому процесі в майбутньому.


Watch video about

Генератор ідей на основі ШІ перевершує людських науковців в оригінальності

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 17, 2026, 5:24 a.m.

Дослідження TechSmith 2024 щодо перегляду відео в…

TechSmith Corporation, визначний лідер у сфері візуальної комунікації, випустила свій дослідження 2024 року про перегляд відео, яке ґрунтовно аналізує глобальну залученість та вподобання глядачів щодо навчальних та інформаційних відео.

Feb. 17, 2026, 5:16 a.m.

Штучний інтелект на передовій: Перетворення аналі…

Короткий опис Штучний інтелект (ШІ) трансформує команди продажу в Індії, дозволяючи не лише керівникам, а й представникам передової лінії

Feb. 17, 2026, 5:15 a.m.

Meta Platforms оголошує про інвестицію в розмірі …

У червні 2025 року компанія Meta Platforms Inc.

Feb. 16, 2026, 1:26 p.m.

Компанія ByteDance обіцяє посилити контроль над с…

ByteDance випустила Seedance 2.0 менше тижня тому, викликавши обурення серед художників усього світу вірусним відео, згенерованим штучним інтелектом, у якому Том Круз та Бред Пітт борються між собою.

Feb. 16, 2026, 1:24 p.m.

Штучний інтелект у голосовому диктофоні, який мож…

Ідеальний сценарій для офісних працівників — просто натиснути кнопку на пристрої, який записує зустрічі, транскрибує розмови та перетворює їх у робочі завдання.

Feb. 16, 2026, 1:21 p.m.

Копілот на базі штучного інтелекту від Microsoft:…

Microsoft офіційно інтегрував помічника з штучним інтелектом — Copilot — у широко використовуваний офісний пакет, що стане значним кроком уперед у взаємодії користувачів із програмним забезпеченням для підвищення продуктивності.

Feb. 16, 2026, 9:26 a.m.

Сіданс 2.0

Seedance 2.0 — це сучасна модель перетворення зображень у відео та тексту у відео, створена технологічною компанією ByteDance.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today