lang icon En
Jan. 25, 2025, 11:13 a.m.
4468

DeepSeek пуска революционен модел с отворен код на ИИ, който надминава конкурентите в САЩ.

Brief news summary

На 20 януари китайската AI лаборатория DeepSeek представи своя отворен модел DeepSeek-R1, който получи признание в Силициевата долина за изключителните си математически и логически умения, превишаващи тези на утвърдени конкуренти като OpenAI. Това събитие се случва на фона на повишени технологични напрежения между САЩ и Китай, характеризирани с ограничения на износа, които възпрепятстват достъпа на Китай до авангардни технологии. В отговор на това DeepSeek подчертава оптимизацията на софтуера и отворените инициативи като доказателство за своите иновационни способности. Създаден от Лян Венфенг на хедж фонда High-Flyer, DeepSeek се фокусира върху дългосрочното изследване, а не върху краткосрочните печалби. Екипът от наскоро дипломирани доктори по наука създава колаборативна среда, отличаваща се от конкурентната етика, присъстваща в много технологични компании. За да противодейства на ограниченията на САЩ за висококачествени чипове, като H100 на Nvidia, DeepSeek усъвършенства архитектурата на своя модел за по-ефективно обучение. Използвайки стратегии като Мултиглавно латентно внимание и Смесена експертиза, моделът на DeepSeek функционира с значително намалени изчислителни ресурси в сравнение с конкурентите си. Тази стратегическа адаптация позволява на DeepSeek да продължи напредването на AI в Китай, въпреки съществуващите предизвикателства с износа.

На 20 януари DeepSeek, по-малко известна лаборатория за изследване на изкуствен интелект от Китай, публикува отворен източник модел, който бързо привлече вниманието в Силициевата долина. В документа на компанията се твърди, че DeepSeek-R1 надминава водещи модели като тези на OpenAI в различни математически и логически тестове, демонстрирайки значителни способности при по-ниска цена и с акцент върху откритостта. Успехът на DeepSeek илюстрира нов път за китайските технологични компании в контекста на технологичната студена война; срещайки се с ограничения за износ от САЩ, много от тях са се насочили от изграждане на модели в горните нива към приложения в долните нива. DeepSeek обаче се е фокусирало върху оптимизация на структурите на AI моделите и ефективно използване на ресурсите. Основателят Лян Уенфенг, завършил магистратура по компютърни науки, основа DeepSeek, след като възникна от High-Flyer, виден количествен хедж фонд, който първоначално се концентрираше върху изследванията в дълбочинното учене. Хедж фондът натрупа ресурси за разработка на AI, което доведе до създаването на DeepSeek, отразявайки смяната на фокуса към дългосрочни технологични цели вместо незабавна печалба. Лян спомена, че научното любопитство е движело това начинание, подчертавайки акцента върху напредъка в основните изследвания на AI вместо комерсиализирането на приложения. Екипът на DeepSeek е предимно съставен от наскоро завършили докторска степен от топ китайски университети, създавайки колаборативна среда, фокусирана върху иновационни изследвания.

Този подход се различава от типичните практики в утвърдените китайски технологични компании, където конкуренцията за ресурси често пречи на иновациите. Лян отбелязва, че младите изследователи са по-подходящи за проекти с високи инвестиции поради тяхната ангажираност и липса на утилитарни съображения. Компанията се сблъсква с предизвикателства от страна на митническите ограничения на правителството на САЩ, които ограничават достъпа до усъвършенствани AI чипове. Първоначално притежаваща запас от 10, 000 Nvidia H100 чипа, способността на DeepSeek да се конкурира наложи по-ефективни методи за обучение на модели. Екипът внедри инженерни стратегии и иновационни дизайни, като Мулти-главна латентна внимание (MLA) и Смесени експерти, значително намалявайки изчислителната мощ, необходима за обучението на последния им модел в сравнение с Llama 3. 1 на Meta. Отвореният подход на DeepSeek е спечелил добросъвестност в глобалната AI изследователска общност, позволявайки на компанията да привлече сътрудници и потребители, необходими за подобряване на моделите си. Тази промяна в съществуващия AI ландшафт може да постави под въпрос ефективността на текущите ограничения за износ на САЩ, като демонстрира, че авангардни модели могат да бъдат разработвани с оптимизирана употреба на ресурсите, водеща до потенциални промени в възприятията за китайските AI способности.


Watch video about

DeepSeek пуска революционен модел с отворен код на ИИ, който надминава конкурентите в САЩ.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 5:37 a.m.

Видеа с дийпфейк, генерирани от изкуствен интелек…

Бързият напредък на изкуствения интелект доведе до забележителни иновации, особено технологията за дийпфейк.

Dec. 19, 2025, 5:28 a.m.

Йан ЛьоКун от Meta се стреми към оценка от 3,5 ми…

Йан Лекун, известен изследовател в областта на изкуствения интелект и бъдещ бивш главен учен-специалист по ИИ в Meta, стартира революционна стартъп компания в тази сфера.

Dec. 19, 2025, 5:24 a.m.

САЩ започват проверка на продажбите на напреднали…

Администрацията на Тръмп започна всеобхватен междусекторен преглед с цел разглеждане на одобрението за износ на напредналите AI чипове H200 на Nvidia към Китай, което бележи значителна промяна спрямо ограниченията, наложени по време на управлението на Байдън, които практически забраняваха такива продажби.

Dec. 19, 2025, 5:24 a.m.

Защо рождественският клип на McDonald's с изкуств…

През декември 2025 г.

Dec. 19, 2025, 5:21 a.m.

Революция в SEO с изкуствен интелект: Необходимос…

Дигиталната маркетингова среда изпитва значителна трансформация, подхранвана от възхода на изкуствения интелект (ИИ) в оптимизацията за търсачки (SEO).

Dec. 18, 2025, 1:30 p.m.

Микрон дава оптимистична прогноза за продажбите, …

Блумбърг Micron Technology Inc, най-големият производител на паметови чипове в САЩ, публикува оптимистична прогноза за текущото тримесечие, като посочи, че нарастващото търсене и недостигът на доставки позволяват на компанията да взема по-високи цени за продуктите си

Dec. 18, 2025, 1:29 p.m.

Новините и информацията, които трябва да знаете з…

Според последно изследване на Boston Consulting Group (BCG), доверието в генеративния изкуствен интелект (ИИ) сред водещите професионалисти в рекламната индустрия достига рекордни нива.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today