lang icon English
Jan. 3, 2025, 6:36 a.m.
2163

परीक्षेत यश मिळवूनही एआय मॉडेल्स रुग्णांच्या संभाषणांमध्ये अडचण अनुभवतात.

Brief news summary

प्रगत AI मॉडेल्स जसे की GPT-4 व्यावसायिक वैद्यकीय परीक्षांमध्ये उत्कृष्टता दाखवतात, परंतु अचूक निदानासाठी अत्यावश्यक असलेल्या संवादात्मक परिस्थितींमध्ये अडचणी येतात. हार्वर्डच्या प्रणव राजपुरकर यांनी नमूद केले आहे की हे मॉडेल्स बहुपर्यायी प्रश्न चांगल्या प्रकारे हाताळतात परंतु निदान कार्यांसाठी अत्यावश्यक असलेल्या उघड्या विचारसरणीच्या कार्यांमध्ये अडथळा येतो. संशोधकांनी 2,000 यू.एस. वैद्यकीय मंडळाच्या प्रकरणांवर आधारित डॉक्टर-रुग्ण संवादांच्या सिम्युलेशनचा वापर करुन मूल्यांकन दृष्टिकोन तयार करून हा प्रश्न सोडवला. ही पद्धत वैद्यकीय इतिहास घेणे यासारख्या क्षमतांचे मूल्यांकन करते, जे पारंपारिक परीक्षा अनेकदा दुर्लक्ष करतात. CRAFT-MD बेंचमार्कमध्ये वास्तव जीवनाच्या परिस्थिती दाखवल्या जातात जिथे AI ने रुग्णांकडून आवश्यक माहिती काढणे आवश्यक असते. या सिम्युलेशनमध्ये, GPT-4 एक रुग्ण AI म्हणून भूमिका बजावते जो निदान करण्यासाठी क्लिनिकल AI सोबत संवाद साधतो, नंतर मानवी तज्ज्ञांनी त्याचे मूल्यांकन केले जाते. GPT-3.5, GPT-4, Meta चा Llama-2-7b, आणि Mistral AI चा Mistral-v2-7b सारख्या मॉडेल्सने लेखी चाचण्यांमध्ये चांगली कामगिरी केली, परंतु संवादात्मक मूल्यांकनांमध्ये अडचणीत आले. उदाहरणार्थ, GPT-4 ने संरचित डेटावर 82% अचूकता प्राप्त केली परंतु संवादात्मक सिम्युलेशनमध्ये ती 26% पर्यंत कमी झाली. जरी त्याने 71% प्रकरणांमध्ये संपूर्ण वैद्यकीय इतिहास पूर्ण केला, तरीही GPT-4 ने बऱ्याचदा बरोबर निदान करण्यात अपयश आले जरी इतिहास अचूक होता. Scripps Research Translational Institute चे एरिक टोपॉल सूचित करतात की सिम्युलेटेड संवाद पारंपारिक परीक्षांच्या तुलनेत AI कार्यक्षमतेबद्दल अधिक सखोल अंतर्दृष्टी प्रदान करतात. राजपुरकर यांचा असा विश्वास आहे की बेंचमार्कमध्ये उत्तम कामगिरी करणे हे AI चे क्लिनिकल सहाय्य साधन म्हणून संभाव्यतेचे निर्देशक ठरू शकते, परंतु अनुभवी डॉक्टरांच्या सूक्ष्म विवेकाचा तोड होऊ शकणार नाही. वास्तव जागतिक वैद्यकीय सराव यात जटिलता समाविष्ट असते जसे की रुग्ण व्यवस्थापन, टीमवर्क, आणि आरोग्य सेवा प्रणालीमध्ये मार्गक्रमण करणे, जे सिम्युलेशन्स पूर्णपणे समजावून घेऊ शकत नाहीत.

उन्नत AI मॉडेल्स व्यावसायिक वैद्यकीय परीक्षांमध्ये चांगली कामगिरी करतात, परंतु डॉक्टर्ससाठी महत्त्वाच्या क्षेत्रात कमी पडतात: रुग्णांशी संभाषण करताना जीवनावश्यक वैद्यकीय माहिती गोळा करणे आणि अचूक निदान करून देणे. हार्वर्ड विद्यापीठातील प्रणव राजपूतकर म्हणतात, "मोठ्या भाषिक मॉडेल्स विविध पर्यायी प्रश्नांच्या चाचण्यांमध्ये उत्तम कामगिरी करतात, पण त्यांची अचूकता गतिशील संभाषणांमध्ये लक्षणीयरीत्या कमी होते, विशेषतः मुक्त निदानात्मक विचारविन्यासात अडचण होते. " हा मुद्दा स्पष्ट झाला, जेव्हा संशोधकांनी एक आधुनिक वैद्यकीय AI मॉडेलची विचार करण्याची क्षमता डॉक्टर-रुग्ण संवादाद्वारे मूल्यमापन करण्याची पद्धत निर्माण केली, यामध्ये "रुग्णांना" प्रमुखतः युनायटेड स्टेट्सच्या वैद्यकीय बोर्ड परीक्षांमधील 2, 000 वैद्यकीय प्रकरणांतून निवडण्यात आले. हार्वर्डमधील श्रेया जोहरी सांगतात, "रुग्ण संवाद सादर करणे आम्हाला वैद्यकीय इतिहास घेण्याचे आवश्यक कौशल्य मूल्यांकन करण्यास मदत करते, जे फक्त प्रकरणांच्या वर्णनांनी तपासल्या जाऊ शकत नाहीत. " नवीन बेंचमार्क, CRAFT-MD, वास्तविक जीवनातील परिस्थिती दर्शवते जिथे रुग्ण महत्वपूर्ण तपशील शेअर करत नाहीत जोपर्यंत त्यांना विशिष्ट प्रश्न विचारले जात नाहीत. CRAFT-MD बेंचमार्क AI चा वापर करतो, ज्यात OpenAI च्या GPT-4 ने "रुग्ण AI" म्हणून संभाषणात सहभाग घेतला आणि परीक्षित "क्लिनिकल AI" सोबत संवाद झाला. GPT-4 ने हि गुणवत्ता परीक्षणासाठी मदत केली, जिथे क्लिनिकल AI च्या निदानाची बरोबर उत्तरांशी तुलना केली गेली, मानवी वैद्यकीय तज्ञांनी या मूल्यमापनांचे सत्यापन केले आणि खात्रीशीर झाल्याने समालोचनांचे पुनरावलोकन केले. प्रयोगांनी उघड केले की चार आघाडीच्या भाषिक मॉडेल्स—OpenAI चे GPT-3. 5 आणि GPT-4, Meta चा Llama-2-7b, आणि Mistral AI चा Mistral-v2-7b—संवाद आधारित बेंचमार्कवर लिखित केस सारांशांच्या तुलनेत अत्यंत खराब कामगिरी केली. OpenAI, Meta, आणि Mistral AI यांनी टिप्पणी देण्यास नकार दिला. उदाहरणार्थ, GPT-4 ने संरचित केस सारांश आणि बहुपर्यायी उत्तरांसह 82% निदानाची अचूकता मिळवली, ज्याचे पर्याय नव्हते तेव्हा 49% पेक्षा कमी झाली.

त्याची अचूकता केवळ 26% राहिली जेव्हा ते सिम्युलेटेड रुग्ण संभाषणांमधून निदान करत होते. अभ्यासामध्ये GPT-4 हा सर्वोच्च कामगिरी करणारा AI होता, GPT-3. 5 अनेकदा दुसऱ्या स्थानी, Mistral AI कधी दुसऱ्या किंवा तिसऱ्या स्थानी आणि Meta चा Llama साधारणतः खालच्या स्थानी होता. AI मॉडेल्स पूर्ण वैद्यकीय इतिहास गोळा करण्यातही कमी पडले, GPT-4 ने सिम्युलेटेड संभाषणांमध्ये हे केवळ 71% वेळा साध्य केले. जरी संबंधित इतिहास गोळा केले तरी, बरोबर निदान हमखास नव्हते. अशा सिम्युलेटेड संभाषणांनी "स्त्रुत्यंतर सहायक" मूल्यांकन केले आहे, AI क्लिनिकल विचार करण्याची क्षमता मानक वैद्यकीय परीक्षांच्या तुलनेत, एरिक टोपोल ऑफ द स्क्रिप्स रिसर्च ट्रान्सलेशनल इंस्टिट्यूट म्हणतात. तथापि, एक AI मॉडल अखेरीस या बेंचमार्कमध्ये उजवतो, रुग्ण संभाषणांमधून साहित्यिक करतानाही, राजपूतकर म्हणतात की असे निदान करतानाही मानवी चिकित्सकांना मात मिळणार नाही. खरेदी वैद्यकीय व्यवहार अधिक जटील आहे, ज्यात अनेक रुग्ण, संघाचे समन्वय, शारीरिक परीक्षणे आणि आरोग्यसेवेमध्ये गुंतलेल्या जटील सामाजिक आणि प्रणालीक घटकांचा समावेश होतो. "आमच्या बेंचमार्कवर चांगली कामगिरी AI साठी चिकित्सक कार्यासाठी एक शक्तिशाली सहाय्यक साधन सूचित करते—पण अनुभवी चिकित्सा विशेषज्ञांच्या सर्वांगीण निर्णयाची जागा घेणे शक्य नाही, " राजपूतकर म्हणतात.


Watch video about

परीक्षेत यश मिळवूनही एआय मॉडेल्स रुग्णांच्या संभाषणांमध्ये अडचण अनुभवतात.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Nov. 15, 2025, 1:22 p.m.

उत्पन्न करणाऱ्या एआयचे विपणन क्रांती: २०२५ मध्ये प्रभुत्…

जलद बदलत असलेल्या डिजिटल मार्केटिंग क्षेत्रात, निर्माणकारी एआय ही नव्या काहीतरी म्हणून सुरु झाली होती, पण आता ती गरज बनली आहे.

Nov. 15, 2025, 1:18 p.m.

अँथ्रोपिक आणि मायक्रोसॉफ्ट यांनी नवीन AI डेटा सेंटर …

2025 च्या नोव्हेंबर 12 रोजी, AI उद्योगाने मोठ्या पातळीवर गुंतवणूक आणि प्रगती पाहिली जेव्हा Anthropic आणि Microsoft यांनी अमेरिकेत नवीन AI संगणकीय पायाभूत सुविधा निर्माण करण्याच्या महत्त्वाकांक्षी योजना जाहीर केल्या.

Nov. 15, 2025, 1:17 p.m.

एआय-शक्त असलेल्या वैयक्तिकरणाने २०२५ मध्ये हॉटेल विक्र…

काही वर्षांपूर्वी, अग्रगण्य हॉटेल विक्रीवाले त्यांची एक महत्त्वाची कौशल्य होती: ते सहजतेने त्यांचे पाहुणे ओळखू शकत होते.

Nov. 15, 2025, 1:12 p.m.

एआय व्हिडिओ कॉन्फरन्सिंग टूल्स दूरस्थ कामकाज सहयोग सुल…

दूरस्थ कामकाजाकडे वेगाने होणारा बदल मोठ्या प्रमाणावर AI-सक्षम व्हिडिओ कॉन्फरन्सिंग प्लॅटफॉर्म्सच्या स्वीकाराला चालना देत आहे.

Nov. 15, 2025, 1:11 p.m.

एआय आणि एसइओ: शोध इंजीन ऑप्टिमायझेशनच्या भविष्यातील …

कृत्रिम बुद्धिमत्ता (AI) च्या उदयामुळे सर्च इंजिन ऑप्टिमायझेशन (SEO) मध्ये खोलवर बदल होत आहेत, ज्यामुळे मार्केटर्स त्यांच्या ऑनलाइन दृश्यता आणि सामग्री रणनीतीला अधिक प्रभावी बनवण्यासाठी नवीन मार्ग शोधत आहेत.

Nov. 15, 2025, 9:31 a.m.

एआय व्हिडिओ संक्षेपण उपकरणे सामग्री वापरात मदत करतात

ऑनलाइन व्हिडिओ सामग्रीच्या वेगाने वाढत्या प्रमाणामुळे ही माहिती समजून घेण्यासाठी व त्याचे कार्यक्षम पद्धतीने कसे उपभोगायचे, याची गरज कधीही इतकीนอळी नव्हती.

Nov. 15, 2025, 9:22 a.m.

मायक्रोसॉफ्टचे Azure AI प्लॅटफॉर्म नवीन साधनांसह विस्त…

मायक्रोसॉफ्टने आपली Azure AI प्लॅटफॉर्मची मोठी विस्तार घोषणा केली आहे, यामध्ये मशीन लर्निंग व डेटा अॅनालिटिक्स क्षमतांना वाढविण्यासाठी नवे टूल्स समाविष्ट केले आहेत.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today