lang icon En
Jan. 2, 2026, 9:10 a.m.
1913

Deepseek წარმოგიდგენთ მრავალმკლავ-შეგუბილ ჰიპერკავშირების დაყენებას ეფექტიანი დიდი ენის მოდელის பயრობისთვის

Brief news summary

ჩინური ხელოვნური ინტელექტის კომპანია Deepseek-მა წარმოადგინა ახალი სასწავლო მეთოდი სახელწოდებით Manifold-Constrained Hyper-Connections (mHC), რომლის მიზანია დიდი სუბიექტური მოდელების გამოტარების ეფექტურობის გაუმჯობესება და ღირებულების შემცირება. ეს მიდგომა ეფუძნება Hyper-Connections ტექნოლოგიას, რომელიც თავდაპირველად განივითარეს Bytedance-მა 2024 წელს, და რომელიც თავად არის დაფუძნებული Microsoft Research Asia-ის ResNet არქიტექტორაზე. Deepseek-ის mHC მეთოდი უზრუნველყოფს უფრო სტაბილურ და მასშტაბურ სასწავლო პროცესებს შენად არ ამატებს გამოთვლითი რესურსის ხარჯს, ეს არის კონკრეტული ინფრასტრუქტურული ოპტიმიზაციების შედეგი. კომპანიის წარმატებით გამოცადული აქვს mHC-ი ლენგვიჯის მოდელებზე, რომლებშიც რაოდენობა მიაღწია 27 მილიარდ პარამეტრს, რაც უჩვენებს პერსპექტივას და შეიძლება გავლენა მოახდინოს ხელოვნური ინტელექტის განვითარების მომავალზე, რადგან დიდი მოდელების სწავლება გახდება უფრო ხელმისაწვდომი და ეფექტური.

ჩინური AI კომპანია Deepseek-მა შემოგვთავაზა ახალი ტრენინგი ტქვენი სახელით მანიფოლდ-კონტრაქტული ჰაიპერკონექშნები (mHC), რომელიც მიზნად ისახავს დიდი ენის მოდელების უფრო ეფექტურ და ეკონომიკურ ტრენინგს, South China Morning Post-ის ინფორმაციით. ეს მიდგომა წარმოადგენს ორიგინალური ჰაიპერკონექშონების კონცეფციის მენატვრობას, რომელსაც Bytedance-ი დაამუშავა 2024 წელს. ის ტექნოლოგია ეფუძნება Microsoft Research Asia-ს შექმნილ კლასიკურ ResNet არქიტექტურას. Deepseek-ი აცხადებს, რომ mHC უზრუნველყოფს უფრო სტაბილურ და მასშტაბურ ტრენინგს, გამმაგრებული ხარჯების გარეშე, რაც მოხერხდა ინფრასტრუქტურის მიზნობრივი ოპტიმიზაციით.

მკვლევარებმა წარმატებით დაამტკიცეს ეს მეთოდი მოდელებზე, რომლებიც შეიცავს jusqu 27 მილიარდ პარამეტრს, შედეგით, რომელიც დადებითია.


Watch video about

Deepseek წარმოგიდგენთ მრავალმკლავ-შეგუბილ ჰიპერკავშირების დაყენებას ეფექტიანი დიდი ენის მოდელის பயრობისთვის

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Feb. 17, 2026, 5:24 a.m.

TechSmith-ის 2024 წლის ვიდეო მიმზიდველი კვლევა აგ…

TechSmith Corporation, ცნობილი ვიზუალური კომუნიკაციის ლიდერი, გამოაცხადა ახალი 2024 წლის ვიდეოს მაყურებლის კვლევა, რომელიც წარმოადგენს uitgebreide ანგარიშს გლობალურ მაყურებელთა ჩართულობის და სასწავლო და საინფორმაციო ვიდეოების საკითხზე.

Feb. 17, 2026, 5:16 a.m.

ინოვაცია წინამძღოლზე: გაყიდვების ინტელიგენციის ცვ…

სინოპსისი მწარმოებელი ხელოვნური ინტელიგენცია (AI) transform-ებს გაყიდვების გუნდებს ინდოეთში და ძალისხმევას არ იძლევა მხოლოდ აღმასრულებლებს, არამედ ფრონტლაინ პერსონალსაც

Feb. 17, 2026, 5:15 a.m.

მეტა პლატფორმებმა გამოაცხადეს 10 მილიარდ დოლარიან…

2025 წლის juin თვეში, Meta Platforms Inc.

Feb. 16, 2026, 1:26 p.m.

ByteDance დააპირებს თავისი ახალი AI ვიდეო გენერატ…

ByteDance-მა ცოტა ხნის წინ გაათავისუფლა Seedance 2.0, რაც მსოფლიოს მასშტაბით მომუშავე ხელოვანებში პროვოცირების გამო გამოიწვია, სადაც ვირუსული AI-ის შექმნილი კლიპი გამოავლინა ტომ კრუზისა და ბრედ პიტის ბრძოლით.

Feb. 16, 2026, 1:24 p.m.

ასისტენტიანი ხმოვანი დამწერი, რომელიც შეუძლია გაყ…

სწორი სცენარი ოფისის თანამშრომლებისთვის არის უბრალოდ დაჭერო ღილაკი მოწყობილობაზე, რომელიც ჩანაწერს შეხვედრებს, ტრანსკრიბავს საუბარს და უქმნის მათ გამოსადეგ დანიშნულებას.

Feb. 16, 2026, 1:21 p.m.

Microsoft's AI-დაწინაურებული კოპილოტი: პროდუქტიულ…

Microsoft-მა ოფიციალურად ინტეგრირა AI-ს ძალით მომღერალი ასისტენტი, Copilot, თავის ფართოდ გამოყენებად Office Suite-ში, რაც წარმოადგენს მსხვილ პროგრესიებს მომხმარებლის ურთიერთობაში პროდუქტიულობის პროგრამულ სისტემებთან.

Feb. 16, 2026, 9:26 a.m.

სედეინდი 2.0

Seedance 2.0 წარმოადგენს უახლეს ტექნოლოგიას, რომელიც გაქვთის-ისა და ტექსტიდან ვიდეოზე გადატვირთვა უკეთესად ამუშავებს, შექმნილია ტექნიკური კომპანია ByteDance-ის მიერ.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today