AI ചാറ്റ് ബോട്ടുകൾ സ്ഥിരമായ ഹല്യൂസിനേഷൻ പ്രശ്നങ്ങളെ അഭിമുഖീകരിച്ച് വിശ്വാസ്യതയെ ബാധിക്കുന്നു

கடந்த சில மாதங்களில் முன்னணி தொழில்நுட்ப நிறுவனங்களான OpenAI மற்றும் Google ஆகியவற்றின் AI செயற்கைததிர்க்காளிகள், பதில்களின் நம்பிக்கையை மேம்படுத்தும் நோக்கில் காரணமுள்ள வலியுறுத்தலைக் கொண்ட பண்புக்களை பெறுகின்றன. ஆனாலும், அண்மைக் পরীক্ষা нәтижிடைகள் காட்டுகின்றன, சில புதிய மாதிரிகள் முன்பு உள்ளடக்கிய பொருள்களைவிடக் குறைவான செயல்திறன் காட்டுகின்றன, ஒரு "புனைவு" என்ற phenomena-ஐ வெளிப்படுத்துகின்றன—செயற்கைததிர்க்காளிகள் தவறான தகவல்களை உருவாக்கும் அல்லது உண்மையானாலும், தொடர்பில்லாத அல்லது வழிகாட்டுதலுக்கு ஏற்றவாத பதில்களை வழங்கும் பிழைகள். இந்த பிரச்சனை, OpenAI-யின் ChatGPT மற்றும் Google-யின் Gemini போன்ற பெரிய மொழி மாதிரிகளின் (LLMs) ஆரம்பம் முதலே நிலவுகின்றது, மற்றும் இதை முற்றிலும் தீர்க்கும் வாய்ப்பு ნაკლებமானது போல தெரிகிறது. OpenAI-யின் தொழில்நுட்ப அறிக்கையிடுகையில், ஆகஸ்ட் வெளியிடப்பட்ட o3 மற்றும் o4-mini மாதிரிகள், 2024 ஆம் ஆண்டு இறுதியில் வந்த பழைய o1 மாதிரியைவிட மிகவும் உயர்ந்த புனைவு விகிதங்களை கொண்டிருந்தன: o3 இற்குப் 33%, o4-mini க்கு 48%, இப்போது பொதுவாக கிடைக்கும் தரவுகளை சுருக்கும்போது, o1 இற்கு 16%. அதேபோல, Vectara-யின் முன்னணி தரவு மேலாண்மை பிளட்ஃபாரத்தில் உள்ள புனைவு விகிதங்களை கண்காணிப்பதில், DeepSeek-R1 மற்றும் பிற காரணமுள்ள மாதிரிகள், பதிலளிப்பதற்கு முன் பல அடிக்கு காரணமுள்ள முறைகளைப் பயன்படுத்தினாலும், முன்னோடிகளிடம் ஒப்பிடும்போது தமிழ்ப் புண்னியங்களின் எண்ணிக்கையில் முக்கிய உயர்ச்சியைக் கண்டனர். OpenAI கூறுகின்றது, காரணம்-பொறுத்த செயல்முறைகள் புண்னியவிலக்கானவை நான்கீடு என்றுதான், அவை புண்னியங்கள் குறைக்கச் செய்யும் வகையில் ஆராய்ச்சி செய்து கொண்டிருக்கின்றனர். புண்னியங்களின் நிலைத்தன்மை சில பயன்பாடுகளை பாதிக்கக்கூடும்: தவறான உண்மைகளை மீட்கும் மாடல்கள், ஆய்வுக்கு உதவக்கூடியதே தவிர, சட்ட நிலைகளை தவறாகக் கருதி தவறான வழக்குகள் நேரிடும் paralegal ப bots; பழைய அல்லது தவறான தகவல்களை கொண்ட வாடிக்கையாளர் சேவை நம்பிக்கை குறைகிறது. துவக்கத்தில், AI நிறுவனங்கள் புண்னியங்கள் காலப்போக்கில் குறைந்து வரும் எதிர்பார்ப்பு இருந்தது, ஆரம்ப மாதிரித் திருத்தல்களில் முன்னேற்றம் காட்டியது. ஆனால், சமீபத்திய உயிருக்கான புண்னிய விகிதங்கள், காரணமுள்ள செயல்கள் இடம்பெற்றாலும், இந்த பாக்கியத்தை சவாலாக்குகின்றன.
Vectara-யின் முன்னணி தரவு கண்காணிப்பில், OpenAI மற்றும் Google-இன் காரணமுள்ள மற்றும் காரணமில்லாத மாதிரிகள் இடையே புண்னிய விகிதங்கள் பகுப்பாய்வு, வேறுபாட்டை காட்டியது, ஆனால் எண்கள் முக்கியமல்ல, இடைநிலையைக் காட்டுகின்றன. Google பதில் அளிக்க மறுத்தது. ஆனால், அத்தகைய தரவரிசைகளுக்கு சில வரம்புகள் உள்ளன. அவை வேறுபடுவான புண்னிய வகைகளையும் சேர்க்கின்றன; எடுத்துக்காட்டாக, DeepSeek-R1 இன் 14. 3% புண்னிய வழக்குகள் பெரும்பாலும் "பாசமுடைய" நிலைகளான, வரைபடத் தளபாடத்தில் ஆதரவு பெற்ற, ஆனால் மூல உரையில் இல்லை. கூடுதலாக, உரை சுருக்குவதைக் கொண்ட போட்டித் திறனுக்கேற்ப, மற்ற பணிகளுக்கான புண்னிய அளவுகள் இதை போன்ற முறையில் காட்ட முடியாது, ஏனெனில் LLMs கள் குறிப்பிட்ட முறையால் சுருக்கத்திற்கு வடிவமைக்கப்படவில்லை. ytEMily Bender, University of Washington, கூறுகின்றார், இத்தரமற்ற மாதிரிகள், உரையின் உண்மையை நிச்சயப்படுத்தும் கடமையை உணர்வு செய்யாமல், முக்கியமான அடுத்த சொற்களை ஊகிக்கின்றன, "புனைவு" என்ற சொல்லை தவறாகவும், மனிதப் போலி இனம் புரிவது போலவும் காட்டுகிறது. Bender, "புனைவு" என்ற சொல்லை எதிர்த்து, அதன் தவறுகள் நம்பகமான அமைப்புகளில் இழிவுச் சுடுகாடுகளைப் போல்கள் என்பதையும், மனித போலியான பார்வையை AI களுக்கு அளிப்பதை எதிர்க்கின்றார்; அதேபோல், Princeton-இன் Arvind Narayanan, மாதிரிகள், நம்பகமற்ற அல்லது காலதாமதமான தகவல்களை நம்பி தவறுகள் நிகழ்கின்றன, மற்றும் பயிற்சி தரவுகளை சேர்த்தலும் கணினி சக்தியை அதிகரித்தலும் இக்கேட்டிதலைத் தீர்க்கவில்லை என்பதாகக் கூறுகின்றார். இதனால், தவறுகள் குறைந்த AI மாதிரிகள் என்ற நிலை நீடித்தால் கூட, இவை நிச்சயமாக ஒரு நிலையான உண்மை ஆகும். Narayanan, இவை உண்மை பரிசோதனையை விரைவு செய்வதற்கான பயன்பாடுகளுக்கு மட்டும் பயன்படுத்தப்பட வேண்டும்; Bender, factual தகவல்களுக்கு AIச் செயற்கைததிர்க்காளிகளை முற்றிலும் தவிர்க்க பரிந்துரைக்கின்றார்.
Brief news summary
OpenAI மற்றும் Google போன்ற நிறுவனங்களால் கண்டுபிடிக்கப்பட்ட சமீபத்திய செயற்கை நுண்ணறிவு சந்தைபோட்டிகளின் முன்னேற்றங்களில், நினைவுப் பயன்பாடு மற்றும் துல்லியத்தை மேம்படுத்துவதில் கவனம் செலுத்தப்பட்டாலும், எடுப்பனவு இல்லாத, பொய்யான அல்லது தவறான தகவல்களை உருவாக்கும் நிகழ்வுகள் அதிகரித்து வருகின்றன—இதுவே "ஹாலுசினேஷன்" எனப்படும். உதாரணமாக, OpenAI-யின் புதிய o3 மற்றும் o4-mini மாதிரிகள், பழைய o1 மாதிரியைப்போல், 33% மற்றும் 48% ஹாலுசினேஷன் விழுகைகள் காட்டுகின்றன, இதே போன்று DeepSeek-R1 மாதிரிகளிலும் இதேபோன்ற நிலைமை காணப்படுகிறது. இவை எதிர்பார்க்கப்பட்ட சவால்கள் இருந்தாலும், OpenAI-யினர் இதற்கான குற்றச்சாட்டு நினைவுப்பொருள்களுக்கு இல்லை என்றும், ஹாலுசினேஷன்-ஐ குறைக்க தொடர்ந்து போராடிக் கொண்டிருக்கின்றனர். இந்த பிரச்சாரம், ஆராய்ச்சி, சட்ட ஆலோசனை மற்றும் வாடிக்கையாளர் சேவை போன்ற தளங்களில், தவறான தகவல்கள் சிரமமான விளைவுகளைக் கொண்டிருக்கக்கூடும் என்பதால் மிகவும் ஆபத்தானது. Vectara நடத்தும் மதிப்பீட்டில், விளக்கமளிப்புகள் மற்றும் அவற்றின் இல்லாத மாதிரிகளின் பிழைகள் தொடர்பாக வேறுபாடுகள் மிக குறைவாக உள்ளன, ஆனால் தரவு வரம்பாகக் குறைவு உள்ளது. நிபுணர்கள் "ஹாலுசினேஷன்" என்பது சிக்கலான பிரச்சனைகளைக் குறைக்காமல், பழைய அல்லது நம்பக்கூடியதாயில்லாத தரவுகளின் dependence-ஐ எளிமைப்படுத்தும் பிழையாக கூறுகின்றனர். தொடர்ந்து நிலவிய தவறுகளை காரணமாகக் கொண்டு, சிலர் செயற்கை நுண்ணறிவுச் சந்தைபோட்டிகளை, தனித்து தகவலைச் சரிபார்க்கும் பணிகளில் மட்டுமே பயன்படுத்தவேண்டும் என முன்வைக்கின்றனர். மொத்தம், ஹாலுசினேஷன்கள், செயற்கை நுண்ணறிவு மொழி மாதிரிகளுக்குள் இன்னும் தீர்க்கப்படாத ஒரு முக்கிய பிரச்சனை ஆகும்.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

ரோபின் ஹுட్ ஐரோப்பாவில் அமெரிக்க விமானிகளின் வர்த்தகத்திற்க…
ராபின்ஹுட் பிளாப்பிளாதான் அடிப்படையிலான ஒரு மேடையை உருவாக்கி வருகிறது, இது யூரோப்பிய வர்த்தகர்களுக்கு அமெரிக்க நிதி சொத்துகளுக்கு அணுகலை வழங்கும் நோக்கத்தில், நிலைமைக்கு அறிய படும் இரண்டு மூலங்கள் புளூம்பெர்க்ுக்கு உரிய ரீதியில் தெரிவித்தது.

OpenAI அறிமுகப்படுத்துகிறது o3-mini: விரைவான, புத்தி…
OpenAI o3-mini என்ற புதிய குணாதிகாரமுள்ள செயற்கை நுண்ணறிவு காரணமுறிவிடும் மாதிரியை வெளியிட்டுள்ளது.

டெதரின் USDT கையா பிளாக்சயினில் துவக்கம், ஆசியாவில் நில…
ஸ்டேபிள்காயின் வழங்குனர் Tether தனது சொந்த USDT ஸ்டேபிள்காயினை ஆகஸ்ட் 2024 இல் மாண்ட Layer 1 நெட்வொர்க்கான Kaia பிளாக்செயினில் Deploy செய்து அறிவித்துள்ளது.

எல்டன் ஜான் மற்றும் டூஆ லிபா ஏ.ஐ. இருந்து பாதுகாப்பைக் கோ…
டுவா லிப்பா, சர் எல்டன் ஜான், சர் आयான் மக்கெலன், ஃபிளோரன்ஸ் வேல்ச், மற்றும் அதIKA 400க்கும் மேற்பட்ட பிரித்தானிய இசைய பலகை, எழுத்தாளர்கள் மற்றும் படைப்பாளர்கள் பிரதமர் சர் கியர் ஸ்டார் முதியவருக்கு உருவாக்கப்பட்ட வேலைகளின் தவறின்றி பயன்படுத்தப்படுவதை தடுக்கும் பிசி உரிமை சட்டங்களை புதுப்பிக்க கோரிக்கை விடுத்துள்ளனர்.

நிதி உள்ளீட்டு அல்லது நிதி அடைவுக்கான முயற்சிகளில் பிளா…
பிளாக் சைன் தொழில்நுட்பம் உலகளாவியதாக நிதி சேர்க்கையை முன்னேற்றும் சக்திவாய்ந்த கருவியாக தற்போது மிகவும் அறியப்படுது, குறிப்பாக பரிசுத்தாலும் சேவை இல்லாத மக்களுக்கும் பாரம்பரிய வங்கி சேவைகளுக்கு அணுகல் இல்லாத மக்களுக்கும்.

சுகாதாரத்தின் பிளாக்க்செயின்: நோயாளி தகவல்களை பாதுகாப்பது
மருத்துவ சேவைத் துறையில் பாதுகாப்பு மற்றும் நோயாளி சுகாதார பதிவுகளின் மேலாண்மையை மேம்படுத்தBlockchain தொழிநுட்பம் முக்கிய மாற்றங்களை செய்யக்கூடியதாக மாறிவருகிறது.Blockchain என்பது பரிமாற்ற நாணயங்களை அடிப்படையாகக் கொண்டதாகவே குறிப்பிடப்படுகிறது, ஆனால் இது தற்போது முக்கியமான மருத்துவ தரவுத்தள சவால்களை சமாளிக்க ஒரு மாற்றமற்ற பதிவுத்தளத்தை உருவாக்கி, நோயாளியின் தரவுகள் tamper-proof (திருட்டுக்கு எதிரானவையாக) மற்றும் அனுமதியின்றி அணுக முடியாத வகையில் பாதுகாக்கப்படுகிறது.இந்த புதுமை, இருக்க்கப்பட்ட மருத்துவ தகவல்களின் பாதுகாப்பை மீறல்கள் மற்றும் அனுமதியில்லாத அணுகல்களிலிருந்து அதிவேகமாக முன்னேற்றுகிறது.

போப் லியோ XIV தனது நோக்கத்தை விளக்கி செயற்கை நுண்ணறிவு …
வாடிகான் நகரம் (ஏபி) — சனிக்கிழமையில், பேரரசருவராக பாப்பா லியோ XIV தனது பாப்பசியின் மாற்றத்தை விளக்கினார், மனிதகுலம் எதிர்கொள்ளும் முக்கிய சவாலான செயற்கை நுண்ணறிவை (AI) முக்கியமாக எடுத்துக் கூறினார் மற்றும் பாப்பா பிரான்சிஸ் கொடுத்த முக்கிய முன்னுரிமைகளை தொடருவார் என்று வேண்டுகோள் வைத்தார்.