Չինացի գիտնականները մշակել են կատակներ ստեղծելու AI մոդել
Brief news summary
Չինացի գիտնականների մի խումբ, միջազգային գործընկերների հետ համագործակցությամբ, աշխատում է մոդել ստեղծելու վրա, որը կտերը և մեկնաբանություններ կտրվի պատկերների վրա՝ նպատակ ունենալով լուծել հումորը լինել սուբյեկտիվ և դժվար թարգմանվող: Սովորական մեծ լեզուների մոդելները դժվարանում են ստեղծագործությամբ, ուստի հետազոտողները ներկայացնում են «տրամաբանության Երկոսություն» ունակություն, որը խթանում է նորարարությունը՝ կապելով տարբեր հայեցակարգերը: Հետազոտության արդյունքում, AI-ի կատակները անգլերեն, ճապոներեն և մանդարին լեզուներով համարվել էին ավելի ծիծաղելի, քան համարժեք մոդելները: Խումբը մարզեց Alibaba-ի Qwen մոդելը՝ մարդկային մտածելակերպով պատասխանրաելու համար պատկերներին և տեքստերին: Հետազոտողները հավատում են, որ այս հետազոտությունը կարող է նշանակալի դեր ունենալ ավելի խելացի և զվարճալի ինտերակտիվ բովանդակության ստեղծման մեջ:Չինացի գիտնականների մի խումբ, միջազգային գործընկերների հետ համագործակցությամբ, զբաղվում է արհեստական բանականության մեջ հումորի խնդրի հաղթահարմամբ: Նրանց նպատակը ստեղծել մոդել, որը կկարողանա ստեղծել իր կատակները և տրամադրել սրամիտ մեկնաբանություններ պատահած պատկերների վրա, ինչպես անում են ինտերնետ օգտատերերը: Հումորի բարձր սուբյետիվությունն ու կոնտեքստային կախվածությունը դժվարացնում են թարգմանությունը և AI-ն: Սուն Յաթ-սենի համալսարանի հետազոտողները, Սինգապուրի կառավարման համալսարանի և Հարվարդի համալսարանի հետ համատեղ, հույս ունեն բարձրացնել ստեղծագործականությունը՝ ստեղծելով մոդել, որը կարող է ստեղծել կատակներ, որոնք կհամակցվեն տարբեր անհատների հետ: 154 ինտերնետ օգտատերերի մասնակցությամբ հետազոտության արդյունքում AI-ի կատակները անգլերեն, ճապոներեն և մանդարին չինարեն լեզուներով ավելի ծիծաղելի էին, քան համարժեք մոդելներն, ինչպիսիք են Microsoft Research-ի LLaVA-1. 5 և OpenAI-ի GPT-4v-ը: Հետազոտական խումբը մշակեց «Տրամաբանության Երկրորդություն» (Leap-of-Thought) ունակություն, որը թույլ է տալիս մոդելին ստեղծել ստեղծագործական կապեր տարբեր հայեցակարգերի միջև: Նորարարության և ինտելեկտուալ նվաճումների խթանմամբ՝ այս ունակությունը կարող է առաջատար լինել ստեղծագործական կիրառման համար: Խումբը ներշնչվեց ճապոնական Oogiri խաղից, որն օժանդակում է ստեղծագործ և հումորային պատասխանների ընկալմանը պատկերների վրա: Նրանք ստեղծեցին տվյալների հավաքածու, որը կոչվում է Oogiri-GO, պարունակելով ավելի քան 130, 000 նմուշներ չինարեն, ճապոներեն և անգլերեն լեզուներով, որոնք ներառում էին հումորային պատասխաններ ինտերնետից: Օգտագործելով Սահմանման Երկարսելիության և ինքնաանցկացման տեխնիկաներ, հետազոտողները մարզեցին Alibaba-ի Qwen մոդելը, որպեսզի պատասխանի պատկերներին և տեքստերին մարդկային մտածելակերպով: Այս մոդելը ցույց է տվել, որ խոստումնալից է զվարճալի և ինտերակտիվ բովանդակության ստեղծման մեջ, և խումբը հավատում է, որ այն կարող է կարևոր դեր խաղալ հումորային վառապատկերների և ստեղծագործ սցենարների մշակման գործում: Այս հետազոտությունը ներկայացնում է մեծ լեզուների մոդելներում տրամաբանական երկրորդության ունակության ուսումնասիրությունը, ամրացնելով սահմանները մարդկանց և AI-ի միջև և խթանում ստեղծագործական ուսումնասիրությունն ու հայտնագործությունը:
Watch video about
Չինացի գիտնականները մշակել են կատակներ ստեղծելու AI մոդել
Try our premium solution and start getting clients — at no cost to you