lang icon En
Jan. 3, 2025, 6:36 a.m.
2469

Өвчтөнтэй ярилцахад хиймэл оюуны загварууд шалгалтанд амжилттай тэнцсэн ч гэсэн бэрхшээлтэй тулгардаг.

Brief news summary

Нарийн хиймэл оюуны загварууд болох GPT-4 зэрэг нь мэргэжлийн эмнэлгийн шалгалтуудад амжилттай оролцож байгаа ч нарийн онош тавихад шаардлагатай интерактив нөхцөл байдалд сул талтай байна. Харвардын Пранав Ражпуркар эдгээр загварууд олон сонголттой шалгалтыг сайн давдаг ч оношлогооны даалгаварт чухал гарч ирэх нээлттэй зөвлөгөөнд гацдагийг дурдсан байна. Судлаачид үүнийг шийдвэрлэхийн тулд 2,000 Америкийн эмнэлгийн зөвлөлийн тохиолдлуудад суурилсан эмч-өвчтөн харилцан ярианы симуляц ашиглан үнэлгээний аргыг бий болгожээ. Энэхүү арга нь уламжлалт шалгалтад үл хайхардаг эмнэлгийн түүх авах зэрэг чадварыг үнэлдэг. CRAFT-MD чиглүүлэх шалгуур нь AI-д бодит амьдралын нөхцөлд өвчтөнөөс зайлшгүй мэдээллийг олж авах шаардлагатай эрсдэлийг үзүүлдэг. Эдгээр симуляцад GPT-4 нь клиник AI-тай харилцаж, онош тавих өвчтөн AI-г тоглодог ба дараа нь хүний ​​мэргэжилтнүүдээр үнэлэгддэг. GPT-3.5, GPT-4, Meta-ийн Llama-2-7b, Mistral AI-ийн Mistral-v2-7b зэрэг загварууд бичгээрх шалгалтад сайн байсан ч яриан суурилсан үнэлгээтэй тулгарсан юм. Жишээ нь, GPT-4 бүтцийн мэдээллээр 82%-ийн нарийвчлалттай байсан боловч яриан симуляцад 26% болж буурсан. 71% тохиолдолд бүрэн эмнэлгийн түүхүүдийг бүрдүүлсэн ч GPT-4 зөв түүхүүдтэй байсан ч олонтаа зөв онош тавьж чадаагүй. Scripps Research Translational Institute-ийн Эрик Топол AI-ийн гүйцэтгэлийг уламжлалт шалгалтуудтай харьцуулахад симуляцын ярианууд илүү гүнзгий ойлголт өгдөг гэж үзэж байна. Ражпуркар онцолж, чиглүүлэх шалгуурт амжилттай байх нь AI-гийн эмчилгээний дэмжлэгийн хэрэгсэлтэй байж болох ч туршлагатай эмч нарын нарийн дүгнэлтийг солихгүй гэдгийг дурдсан байна. Бодит ертөнцөд эмнэлгийн практик нь өвчтөн удирдах, багийн ажил, эрүүл мэндийн системд зохицох зэрэг нарийн төвөгтэй байдлыг багтаадаг, харин симуляц үүнийг бүрэн хамрахгүй.

Дэвшилтэт хиймэл оюун ухааны загварууд мэргэжлийн эмнэлгийн шалгалтуудад өндөр амжилттай оролцдог ч эмч нарт шаардлагатай нэг зүйл дээр доголдож байна: эмч, өвчтөний харилцан яриа өрнүүлж чухал эмнэлгийн мэдээлэл цуглуулж, зөв онош гаргах. Харвардын их сургуулийн Пранан Ражпуркар "Томоохон хэлний загварууд сонголттой асуултын шалгалтанд маш сайн амжилт үзүүлдэг ч, харилцааны үед, ялангуяа нээлттэй төгсгөлтэй оношилгооны асуудалд тэдний нарийвчлал ихээхэн буурдаг" хэмээн онцолж байна. Судлаачид эмнэлгийн хиймэл оюун ухааны загваруудын сэтгэн бодох чадварыг шалгах арга боловсруулж, ихэнхдээ АНУ-ын эмнэлгийн зөвлөлийн шалгалтуудаас авсан 2, 000 гаруй эмнэлгийн тохиолдлоос бүрдсэн "өвчтөнүүдтэй" эмч-өвчтөний хиймэл харилцааны симуляцийг ашигласан үед энэ асуудал ил болжээ. Харвардын Шрейя Жохри, “Өвчтөнтэй харилцах байдлыг дуурайлган турших нь бидэнд чухал эмнэлгийн түүх цуглуулах чадварыг үнэлэх боломжийг олгодог бөгөөд энэ нь зөвхөн тохиолдлын товчооноос үнэлэгддэггүй” гэж хэлжээ. Шинээр боловсруулсан CRAFT-MD жишиг нь өвчтөнүүд зөв асуулт асуух хүртэл чухал мэдээллийг хуваалцахгүй байж болох бодит байдлыг илэрхийлдэг ажээ. CRAFT-MD жишиг нь хиймэл оюун ухааныг ашиглан OpenAI-ийн GPT-4-ийг "өвчтөн AI" болгон туршиж буй "эмнэлгийн AI"-тай харилцах байдлаар ашигладаг. GPT-4 мөн оношийг зөв эсэхийг тохиолдол бүрт харьцуулан үнэлгээнд тусалж, үнэн зөвийг шалгахад хүний эмнэлгийн шинжээчид эдгээр үнэлгээг бататгаж, бичилцхийг хянаж байсан байна. Судалгаанд оролцсон дөрвөн тэргүүлэх хиймэл оюун ухааны хэлний загварууд — OpenAI-ийн GPT-3. 5 болон GPT-4, Meta-ийн Llama-2-7b, Mistral AI-ийн Mistral-v2-7b — нь харилцаа-суурилсан сорилтод бичмэл тохиолдолын хураангуйгаас илүү дор үзүүлэлттэй байсан байна. OpenAI, Meta болон Mistral AI-аас ямар нэгэн тайлбар өгөхөөс татгалзжээ. Жишээлбэл, GPT-4 нь бүтэцтэй тохиолдлын хураангуй болон сонголттой хариулттай үед 82%-ийн оношилгооны нарийвчлал үзүүлсэн бөгөөд сонголтгүйгээр энэ нь 49%-аас доош буурсан байна.

Дуурайлган хийсэн өвчтөнүүдтэй харилцан ярианаас онош гаргах үед энэ нь зөвхөн 26%-д буурчээ. GPT-4 нь судалгаанд хамгийн сайн үзүүлэлт үзүүлсэн хиймэл оюун ухаан байсан ба GPT-3. 5 ихэвчлэн хоёрдугаарт, Mistral AI заримдаа хоёрдугаар байранд, Meta-ийн Llama ерөнхийдөө хамгийн доогуур үзүүлэлттэй байжээ. Хиймэл оюун ухааны загварууд мөн эмнэлгийн түүхийг бүрэн цуглуулж чадаагүй байна, харин GPT-4-ийн хувьд 71%-ийн дуурайлгасан харилцан ярианд үүнийг managing хийжээ. Харай тэр үед хүртэл зөв онош баталгаатай биш байсан байна. Эдгээр дуурайлган хийж буй харилцан ярианууд хиймэл оюун ухааны эмнэлгийн сэтгэн бодох чадварыг стандарт эмнэлгийн шалгах сорилтуудаас илүү "үнэ цэнэтэй" үнэлгээ гэж Scripps Research Translational Institute-ийн Эрик Топол тэмдэглэжээ. Гэсэн ч, хэрэв хиймэл оюун ухааны загвар энэ үзүүлэлтэнд эцэстээ тасралтгүй зөв оношилгоог хийх сайжруулалт хийсэн ч гэсэн, Ражпуркар хүний эмч нараас давахгүй гэдгийг онцолсон байна. Бодит ертөнцийн эмнэлгийн практик нь илүү нарийн бөгөөд олон өвчтөнтэй харьцан, багтай хамтран ажиллах, бие махбодийн үзлэгийг гүйцэтгэх, эрүүл мэндийн нарийн төвөгтэй нийгмийн болон системийн шалтгаануудыг ойлгох зэрэгт холбогддог байна. "Манай үзүүлэлтэнд хүчтэй үзүүлэлт үзүүлж байгаа нь хиймэл оюун ухаан эмнэлгийн ажилд хүчитгэсэн тусламжийн хэрэгсэл болж болох ч туршлагатай эмч нарын өргөн хүрээнүүдийг орлуулж чадахгүй гэдгийг харуулж байна" гэж Ражпуркар хэлсэн байна.


Watch video about

Өвчтөнтэй ярилцахад хиймэл оюуны загварууд шалгалтанд амжилттай тэнцсэн ч гэсэн бэрхшээлтэй тулгардаг.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Jan. 1, 2026, 1:38 p.m.

АМД нь $675 сая долларын Алибаба захиалгаар Хятад…

Энэхүү нийтлэл анх GuruFocus сайт дээр нийтлэгдсэн болно.

Jan. 1, 2026, 1:24 p.m.

Nvidia AI21 Labs-ийг худалдан авах талаар ярилцаж…

Nvidia нь Израиль дахь AI21 Labs нэртэй хиймэл оюуны startups-ийн компанийг авчрах санал ярилцаж байна.

Jan. 1, 2026, 1:23 p.m.

Үүнийг хийхэд зориулсан хиймэл оюун ухаан ашиглас…

Линк байгуулах нь үр дүнтэй хайлтын системийн оновчлолын (SEO) үндсэн элемент хэвээр байгаа бөгөөд хиймэл оюун ухааны (AI) сүүлийн үеийн ахиц дэвшил нь энэ чухал үйл явцыг компаниуд хэрхэн өөрчилж буйг өөрчилж байна.

Jan. 1, 2026, 1:21 p.m.

AI-ийн видео багцлах техник нь урсгалын чанарыг с…

Хиймэл оюун ухаан (ХО) цахим технологид хувьсал хийж, ялангуяа видеог гэрийн тэжээлийн системд хэрэглэж эхэллээ.

Jan. 1, 2026, 1:18 p.m.

Хүмүүнд хүлээн зөвшөөрөгдсөн 5 AI фарма маркетинг…

2025 он жил хиймэл оюун ухаан (ХОУ) нь эмийн зах зээлийн багуудын салшгүй хэсэг болж хувирах мөчөөр нэрлэгдэх магадлалтай байна.

Jan. 1, 2026, 1:16 p.m.

Цэвэр Магнийн үндэслэсэн хатуу төлөвийн устөрөгч …

CLNB 2025 (10р) Шинэ эрчим хүчний үйлдвэрлэлийн сүлжээ үзэсгэлэн - Хийрхэг эрчим хүчний салбарын хөгжлийн форумыг SMM Мэдээлэл ба Технологийн ХХК (SMM) хөтөлж байгуулсан бөгөөд, Zhang Yuxiang нь Ai Hydrogen Technology (Suzhou) ХХК-ийн үүсгэн байгуулагч ба захирал бөгөөд “Цэвэр магнийн үндсэн хатуу хэлбэрийн гидрогийн хадгалалт” сэдвээр илтгэл тавив.

Jan. 1, 2026, 9:33 a.m.

News Corp хиймэл оюун ухаан зөвшөөрөл олгох, худа…

News Corp компани 2026 оны Төсвийн жилийн эхний улирлын санхүүгийн үр дүнгээ зарлалаа.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today