പുതിയ പഠനം കാണിച്ചു തരുന്നത് എഐ അളവുകലൈക്കുകളും കലണ്ടർ തീയതി കണക്കുകളും വായിക്കുന്നതിൽ ബുദ്ധിമുട്ടുന്നു

പുതിയ ഗവേഷണം മനുഷ്യർ എളുപ്പത്തിൽ കൈകാര്യം ചെയ്യുന്ന ചില ജോലികൾ ആർട്ടിഫിഷ്യൽ ഇന്റലിജൻസ് (AI) യെതിരെ ബുദ്ധിമുട്ടാണ് സാക്ഷ്യമാക്കുന്നത്—বিশേഷിച്ച് അനലോജClock വായിക്കുന്നത് ഉൾപ്പെടെ, നൽകിയ തീയതിക്ക് ആഴ്ചയുടെ ദിനം നിശ്ചയിക്കുന്നത്. എയ്ആയ് കോഡ്, ചിത്രങ്ങൾ, മനുഷ്യരാരുപോലെ ടെക്സ്റ്റ് സൃഷ്ടിക്കുക തുടങ്ങി വ്യത്യസ്ത തലങ്ങളിൽ പരീക്ഷകളിലും വിജയിക്കുന്നത് സൗകര്യപ്രദമായിരുന്നുവെങ്കിലും, അവ താളക്കൽകൾയുടെ സ്ഥിതിവിവരണവുമായി അസൗകര്യപ്പെടുകയും അടിസ്ഥാന കലണ്ടർ ഗണിതം പബ്ലിക്കുകയും ചെയ്യുന്നു. ഐസിഎൽآർ 2025 അന്താരാഷ്ട്ര പഠന പ്രതിനിധീകരണ സമ്മേളനത്തിൽ (ICLR) അവതരിപ്പിച്ചു, ക്രമീകൃതപ്രതിഷ്ഠിത ഏവാരിയെ (arXiv) പ്രസിദ്ധീകരിച്ചിരിക്കുന്നു (അതിൽ ഇപ്പോഴും പരിഗണന തേടപ്പെടുന്നില്ല), ഈ പഠനം മനുഷ്യർ ആദ്യകാലം പഠിക്കുന്ന ജോലികളിൽ ആർടിഫിഷ്യൽ ഇന്റലിജൻസ് നമുക്കാകെ കാണിക്കുന്ന വലിയ അപര്യാപ്തതകളെ തെളിയിക്കുന്നു. യൂണിവേഴ്സിറ്റി ഓഫ് എഡിന്ബിര്ഡിന്റെ ലീഡ് എഴുത്തുകാരനായ റോഹിത് സാക്സേന ഈ ലംഘനങ്ങൾ പരിഹരിക്കേണ്ടത് അത്യന്താപേക്ഷിതമെന്ന് ഊന്നിമTow പിടിക്കുന്നു, കാരണം അതൊപ്പം സമയംസങ്കടങ്ങളായ സമയക്രമമോ സ്വയംക്കാർമം, സഹായകരമായ സാങ്കേതികവിദ്യകൾ പോലുള്ള യഥാർത്ഥ ലോക സാഹചര്യങ്ങളിലുമാണ് AI പ്രയോഗം ഫലപ്രദമായുള്ളത്. ഗവേഷകർ വിവിധ മൾട്ടിമോഡൽ ലാംഗ്വേജുമായി എല്ലാ വലിയ മോഡലുകളെയും (MLLMs)—മേറ്റയുടെ ല്ലാമ 3. 2-വിജൻ, ആന്റ്രോപിക് ക്ലോഡ് 3. 5 സോനെറ്റ്, ഗൂഗിളിന്റെ ജെമിനി 2. 0, ഓപ്പൺഎഐയുടെ GPT-4o —കളുടെ പ്രത്യേക ഡേറ്റാസെറ്റുകളെ ഉപയോഗിച്ച് പരീക്ഷിച്ചു. മോഡലുകൾ നമૂനകളിൽ ടൈമിംഗ് ശരിയായി തിരിച്ചറിയാനായില്ല, ആഴ്ചകൾ കണക്കാക്കാനായില്ല; കണക്കുകൂട്ടലിലും കണക്കുകൂട്ടലുകളുടെ ശരിയായ നില തിരിച്ചറിയലും നിരവധി തവണ എളുതുകെഴുതിയതും മരുന്ന്, കൃത്യത നിരക്കുകൾ അനുമാനിച്ച് 38. 7% മാത്രമാണ് മണിക്കൂറുകൾക്ക്, 26. 3% മാത്രമാണ് കലണ്ടർ പ്രവർത്തനങ്ങളിൽ. സാക്സേന വിശദീകരിച്ചു, AI-യുടെ തെറ്റായ ടൈം വായനയിൽ ഇന്ന് സ്പേസ് റീസണിംഗിന്റെ കുറവാണ്—ഏതാനും ജോലികളിൽ ഹാൻഡുകളുടെ ഓവർലാപ്പ്, കോണങ്ങളുടെ അളവെടുപ്പുകൾ, മറ്റുമുള്ള വ്യത്യസ്ത ഘടനകൾക്കായ് നോക്കേണ്ടതും, റോമൻ അക്കങ്ങൾ അല്ലെങ്കിൽ സ്റ്റൈലൈസ് ചെയ്ത ഡയലുകൾ പോലുള്ളവ ഉൾപ്പെടുന്നു. ചിത്രത്തെ ഒരു ക്ലോക്കായി തിരിച്ചറിയുന്നത് എളുപ്പമാണ്, എന്നാൽ അതിന് കൃത്യമായ വായന കൈവരിക്കാൻ കഷ്ടമാണ്.
സമാനമായി, ഗണിതം കണക്കുകൂട്ടലിന്റെ അടിസ്ഥാനത്തിൽ ആയിരിക്കുമ്പോഴെങ്കിലും, വലിയ ഭാഷാ മോഡലുകൾ അവ കണക്കുകൂട്ടൽ അൽഗോരിതം വഴി നിർവഹിക്കുന്നതല്ല—ഇവ ട്രെയിനിംഗ് ഡേറ്റാ പാറ്റേണുകളെ ആശ്രയിച്ചാണ് പ്രവചനം നടത്തുന്നത്. ഇത് അസുസ്ഥിരമായ, നിയമപരമായ അല്ലാത്ത ഗണിതം മൂലത്തെയാണ് കാലാവധി കമ്പിളി പിഴവുകൾ പ്രകടമാകുന്നത്. ഈ പഠനം ഉയർന്ന തെളിവുകൾ ചേർക്കുന്നു—AIയുടെ “അര്ഥം” മനുഷ്യൻറെ ബുദ്ധിമുട്ടുള്ള രീതിയിൽ വ്യത്യസ്തമാണ്. AI വിജയിക്കുന്നു അവിടെ താങ്കൾ ഉയർന്ന പരിശീലന ഉദാഹരണങ്ങൾ ലഭിച്ചപ്പോൾ, എന്നാൽ അവ മാന്യതയും സ്പഷ്ടമായ ലോഗികവും ആവശ്യമുള്ള ഘടനകളിൽ പരിമിതമായ തമിഴ് ശേഷിയുണ്ടാക്കുന്നു. കൂടാതെ, ലീപ് വർഷങ്ങൾ പോലുള്ള അപൂർവ സംഭവങ്ങളിലേക്കു പരിമിതമായ പരിശീലന ഡേറ്റാ ആയിരക്കുകൂടി പ്രവർത്തനക്ഷമതയെ തടസം ചെയ്യുന്നുണ്ട്, കാരണം AI നിർവചനം ആവശ്യമുള്ള അടിസ്ഥാന ബന്ധങ്ങൾ കണ്മയമാകുന്നില്ല. ഫലങ്ങൾ വ്യക്തമായി കാണിക്കുന്നു, കൂടുതൽ സമഗ്രമായ, ലക്ഷ്യമിട്ട ഡേറ്റാസെറ്റുകൾ നിർമ്മിക്കേണ്ട ആവശ്യം, കൂടി എഐയുടെ ലాజിക്കലും സ്പേസ് റീസണിംഗും സങ്കലിപ്പിക്കുന്ന മുഹൂർത്തങ്ങൾ തിരിച്ചറിയേണ്ട സമീപനം ആവശ്യമാണ്. സാക്സേന കൂടി പറയുന്നു, കൃത്യമായ ഗണിതം ചേരുന്നതിനും വ്യത്യസ്ത തോഴ്മകളുമായുള്ള സമീപനങ്ങളിൽ അമിതമായി ആശ്രയിക്കാതെ, കർശനമായ ടെസ്റ്റിംഗ്, Fallback സംവിധാനങ്ങൾ, മനുഷ്യന്പോലെ നിരീക്ഷണമെന്തെന്നത് അത്യാവശ്യവും.
Brief news summary
2025 ലത്തെ അന്താരാഷ്ട്ര പഠന പ്രതിനിധീകരണ സമ്മേളനത്തിൽ അവതരിപ്പിച്ചതാണ് പുതിയ ഗവേഷണം, ഇപ്പോഴത്തെ AI മോഡലുകളിൽ ഉള്ള പ്രധാനമായ പരിമിതികളെ ഉയർത്തികാട്ടുന്നത്. അതിൽ മെറ്റയുടെ ല്ലാമാ 3.2-വിഷൻ, ആന്ത്രോപിക്തിരെ ക്ലോഡ്-3.5 സൺനറ്റ്, ഗോഗിള്ിന്റെ ജീമനി 2.0, ഒപ്പം ഓപ്പൺAIയുടെ GPT-4o പോലുള്ള മോഡലുകൾ ഉൾപ്പെടുന്നു. അടുത്തകാലത്തുളള പുരോഗതிகளെ തുടർന്ന് സൃഷ്ടമായ എങ്കിലും, ഈ മോഡലുകൾ മനുഷ്യർക്കിലെത്തുന്നതിനോട് ബന്ധമുള്ള ചട്ടങ്ങളോ, എളുപ്പം മനസ്സിലാക്കാവുന്ന ടാസ്കുകൾക്കോ തകർപ്പണിരക്കങ്ങൾ കാണിക്കുന്നു, ഉദാഹരണത്തിന് അനലോഗ് കൗക്കളും തീയതികളിൽ weekday കണ്ടെത്തൽ എന്നിവ. ഈ പഠനം കാണിച്ചതായി, ഈ മോഡലുകൾ കണക്ക് കാണിക്കുമ്പോൾ ശരിയാമായ സമയം മാത്രം 38.7% തവണയും, കലണ്ടർ തീയതികൾ 26.3% തവണയും മാത്രമാണ് ശരിയായി മനസ്സിലാക്കുന്നത്, ഇവയുടെ pattern recognition-ലേക്ക് മാത്രമായ കൂട്ടിരിക്കുക കാണിക്കുന്നു, യഥാർത്ഥ കരുതലോ സാവകാശമുള്ള ജ്ഞാന ശേഷിയോ ഇല്ലാത്തത്. എഡ്inburgh സർവകലാശാലയിലെ റോഹിത് ശാക്ല എന്ന നേതൃത്ത്വത്തിൽ നടത്തിയ ഗവേഷണത്തിൽ, AI സിസ്റ്റങ്ങൾ ഓബ്ജക്റ്റുകൾ ശരിയായി തിരിച്ചറിയുന്നത് കഴിവുണ്ടെങ്കിലും, അതിനു മുമ്പായി ഒತ್ತು കാണുന്നതിന് ഇരു şeýle ലക്ഷ്യങ്ങൾക്കായി യഥാർത്ഥമായ് ഉള്ള ബഹുമാനമായ spatial, logical reasoning സാധ്യതകളിൽ വലിയ വെല്ലുവിളികൾ നേരിടുന്നു, പ്രത്യേകിച്ച് അപൂർവമായ സംഭവങ്ങൾ പോലെയുള്ള ലീപ് വർഷങ്ങൾ നടക്കുമ്പോൾ. ഇപ്പോഴത്തെ കണ്ടെത്തലുകൾ പുതിയ പരിശീലന രീതികൾക്ക് ആവശ്യമാണ്, These should include logical and spatial reasoning കുത്തകٹن, കൂടാതെ ശരിയായ കണക്കുകൾ ആവശ്യമാകുന്ന ടാസ്കുകളെക്കുറിച്ച് AI-യെ അധികം ആശ്രയിക്കുന്നതിന് മുന്നറിയിപ്പ് നൽകുന്നു. അന്തിമമായി, പഠനം മനുഷ്യ ജ്ഞാനവും AI pattern matching-ലും ഉള്ള അടിസ്ഥാന വ്യത്യാസങ്ങളെ തെളിയിക്കുന്നു, സമയസാർവത്രിക വ്യവസ്ഥകൾക്ക് മനുഷ്യ പരിശ്രമവും കാഴ്ചയും ഉള്ളടക്കം നൽകുന്നു, അതുകൊണ്ട് സ്പഷ്ടമായ പരിശോധനകളും മനുഷ്യ നിയന്ത്രണവും ആവശ്യമാണ്.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

നിവിഡിയെ എഐ വർദ്ധനവ്, മെറ്റക്ക് എഐ തടസ്സം, ആപ്പിളിന്റെ കഠ…
അടുത്ത ബാറ്റിൽ ഗ്രൗണ്ട് എഐ ആയുധയുദ്ധത്തിൽ ബിഎജിംഗ് അല്ല—itാണ് റിയാദ്, കുറഞ്ഞത് വെഡ് mbụഷിന്റെ പ്രകാരം.

പൊതുസന്ദർശന ഇന്റർനെറ്റ് ബ്ലോക്ക്ചെയിൻക്കായി ഒരു തടസ്സമാണ് …
ഓസ്റ്റിൻ ഫെഡെറയുടെ പ്രകാരം, ഡബ്ലൂ Zero എന്ന പ്രോജക്ടിന്റെ സഹസ്ഥാപകനും സിഇഒയുമായ — ബ್ಲോക്ക്ചെയ്നുകൾക്ക് ഉയർന്ന വേഗതയുള്ള ഫൈബർ ഓപ്പ്റ്റിക് അഴyllabus പരിചരിക്കുന്നതിനായി വികസിപ്പിച്ചെടുക്കൽ പദ്ധതിയ് — പൊതു ഇന്റർനെറ്റ് അടിസ്ഥാനസൗകര്യം മുഖ്യ വേഗത തടസ്സവും പ്രകടന പരിമിതിയും നൽകുന്നു.

ഷൂസ്മിത്ത്സ് എഐ സ്വീകരണമൊപ്പം £1 മില്യൺ ബോണസോടെ പ്രോത്സാഹന…
കഴിഞ്ഞ മാസത്തിന്റെ തുടക്കത്തിൽ, ബ്രിട്ടീഷ് നിയമ സ്ഥാപനമായ ഷൂസ്മിത്ത്സ്, ഇത് 1500 തൊഴിലchineകൾ ഉള്ള ഒരു സ്ഥാപനമാണ്, അവരുടെയേ ജീവനക്കാർക്കിടയിൽ പങ്കുവെക്കുന്ന £1 മില്യൺ ബോണസ് പൂളിനെ പ്രഖ്യാപിച്ചു, ജീവനക്കാർ അവരുടെ പ്രവൃത്തി പ്രവാഹങ്ങളിൽ മൈക്രോസോഫ്റ്റിന്റെ AI ടൂൾ, കോ-പൈലറ്റ്, ഒന്നിച്ച് ദൃശ്യമാക്കിയത് എന്ന് ഉറപ്പിറ്റെ.

जेपी മോർഗൺ റിലീസിനോയും ഓندو ഫിനാൻസുമായി സഹകരിച്ച് പ…
JP മോർഗൻ തന്റെ ആദ്യ പബ്ലിക് ബ്ലോക്ക്ചെയ്ൻ ഫെണമേറ്റു, സാമ്പത്തിക മഹാശക്തിയുടെ Web3 ഇക്കോസിസ്റ്റവുമായി ауааԥсыра കൂടുതൽ ബന്ധപ്പെട്ടുവരുന്നതിന്റെയൊരു സൂചനയാണ് ഇത്.

എ ഐ ചിപ്പുകൾ പുതിയ 'രാഷ്ട്രത്തിന്റെ നാണയം' ആയി മാറുന്നു…
© 2025 ഫോർച്ച് മീഡിയ ഐപി ലിമിറ്റഡ്.

കേന്ദ്രബാങ്കുകൾമുണ്ടാക്കുന്നു ബ്ലോക്ക്ചെയ്ൻ, ഫിനാന്ഷ്യേഷൻ പോള…
കേന്ദ്ര ബാങ്കുകൾ സാമ്പത്തിക നയം നടപ്പാക്കുന്നതിൽ പ്രോഗ്രാമെബളമാണ് ബ്ലോക്ക്ചെയിൻ സാങ്കേതികവിദ്യകൾ എങ്ങനെ പരിവർത്തനം തീർക്കാമെന്ന് അന്വേഷിക്കുന്നതിൽ തുടങ്ങി.

സ്റ്റാർ വേഴ്സ്' എഐ പ്രത്യേക ഫലങ്ങളുടെ പ്രദർശനംഒരു പൂർണ്ണ ദ…
ഡിസ്നി ഭരണനയത്തിലെത്തുകയാണെങ്കിൽ, നാം നൽകിയ്ക്കേണ്ടത് അനന്തമായ സ്റ്റാർ വേഴ്സ് റീബൂട്ടുകളിലും സീക്വലുകളിലും സ്പിന്നോഫുകളിലുമാണ്, സൂര്യൻ അടുത്ത കാലത്ത് പൊട്ടിച്ചുമാറാനിടയായതുവരെ.