Przełomowe modele AI DeepSeek przewyższają amerykańskich konkurentów, budząc niepokój w Dolinie Krzemowej.

Relatywnie mało znane laboratorium AI z siedzibą w Chinach wzbudziło niepokój w Dolinie Krzemowej, wprowadzając modele AI, które przewyższają osiągi najlepszych amerykańskich odpowiedników, mimo mniejszych budżetów i mniej zaawansowanych chipów. Znane jako DeepSeek, to laboratorium uruchomiło pod koniec grudnia darmowy i otwarty model językowy, twierdząc, że został stworzony w zaledwie dwa miesiące za mniej niż 6 milionów dolarów, wykorzystując mniej wydajne chipy H800 firmy Nvidia. Te niedawne osiągnięcia zrodziły obawy, że Stany Zjednoczone tracą przewagę w dziedzinie sztucznej inteligencji, rzucając wątpliwości na znaczne inwestycje dokonane przez duże firmy technologiczne w modele AI oraz centra danych. W kilku niezależnych ocenach benchmarkowych model DeepSeek przewyższył znanych konkurentów, w tym Llama 3. 1 firmy Meta, GPT-4o firmy OpenAI oraz Claude Sonnet 3. 5 firmy Anthropic, demonstrując wyższą dokładność w takich obszarach jak rozwiązywanie złożonych problemów, matematyka i programowanie. W poniedziałek DeepSeek zaprezentował r1, model rozumowania, który również przewyższył najnowszy model o1 firmy OpenAI w licznych ocenach zewnętrznych. Podczas dyskusji na Światowym Forum Ekonomicznym w Davos w Szwajcarii, dyrektor generalny Microsoftu, Satya Nadella, zauważył: "Nowy model DeepSeek jest niesamowicie imponujący, skutecznie rozwijając model open-source, który doskonale radzi sobie z obliczeniami w czasie inferencji i jest niezwykle efektywny obliczeniowo. Musimy bardzo poważnie traktować postępy z Chin. " DeepSeek zdołał poradzić sobie z surowymi ograniczeniami w zakresie półprzewodników nałożonymi przez rząd USA, które ograniczają dostęp do zaawansowanych chipów, takich jak H100 firmy Nvidia. Ostatnie przełomy sugerują, że DeepSeek albo odkrył metody omijania tych regulacji, albo ograniczenia eksportowe nie były tak ograniczające, jak się spodziewano. "Mogą wykorzystać solidny, duży model dzięki technice zwanej destylacją, " wyjaśnił Chetan Puttagunta, Partner Generalny w Benchmark. "Zasadniczo, bardzo duży model pomaga mniejszemu modelowi w udoskonalaniu jego zdolności w określonych dziedzinach.
Takie podejście jest bardzo opłacalne. " Informacje na temat DeepSeek oraz jego założyciela, Lianga WenFenga, są nadal skąpe. Laboratorium powstało z chińskiego funduszu hedgingowego o nazwie High-Flyer Quant, który podobno zarządza aktywami wartymi około 8 miliardów dolarów. DeepSeek nie jest jedynym podmiotem w chińskim krajobrazie AI. Znany badacz AI, Kai-Fu Lee, zauważył, że jego startup 01. ai został stworzony z jedynie 3 milionami dolarów inwestycji. Dodatkowo, ByteDance, firma macierzysta TikToka, ogłosiła aktualizację swojego modelu w środę, twierdząc, że przewyższa model OpenAI o1 w istotnym teście porównawczym. "Potrzeba jest matką wynalazku, " stwierdził Aravind Srinivas, dyrektor generalny Perplexity. "W obliczu wyzwań, stworzyli coś znacznie bardziej wydajnego. "
Brief news summary
DeepSeek, wschodzące laboratorium AI w Chinach, zyskuje znaczną uwagę w Dolinie Krzemowej dzięki swojemu przystępnemu modelowi AI, który przewyższa te oferowane przez wiodące amerykańskie firmy technologiczne. Założone w grudniu, w ciągu zaledwie dwóch miesięcy z powodzeniem uruchomiło darmowy, otwartoźródłowy model językowy, wykorzystując mniej niż 6 milionów dolarów finansowania oraz chipy Nvidia H800. Ten szybki postęp budzi obawy co do dominacji USA w dziedzinie AI i podważa skuteczność dużych inwestycji amerykańskich firm. Oceny wykazują, że model DeepSeek konsekwentnie przewyższa konkurencję, taką jak Llama 3.1 od Meta, GPT-4o od OpenAI i Claude Sonnet 3.5 od Anthropic, szczególnie w złożonych zadaniach. Ich model rozumowania r1 zdobył uznanie za przewyższenie o1 od OpenAI, zdobywając pochwały od liderów branży, w tym od dyrektora generalnego Microsoftu, Satyi Nadelli. Pomimo amerykańskich ograniczeń dotyczących półprzewodników, sukces DeepSeek ilustruje innowacyjne metody radzenia sobie z tymi wyzwaniami. Założone przez Lianga WenFenga i wspierane przez fundusz hedgingowy High-Flyer Quant, DeepSeek stanowi przykład odporności chińskich osiągnięć w szybko zmieniającym się krajobrazie uczenia głębokiego.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Il Foglio integruje sztuczną inteligencję w dzien…
Il Foglio, czołowa włoska gazeta, podjęła przełomowy eksperyment z integrowaniem sztucznej inteligencji w dziennikarstwie pod kierownictwem redaktora Claudio Cerasy.

Firma programistyczna zajmująca się kryptowalutam…
© 2025 Fortune Media IP Limited.

Inwestycja Meta w wysokości 14,3 miliarda dolarów…
Meta ujawniła dużą inwestycję w sektorze sztucznej inteligencji, wykupując 49% udziałów w firmie AI Scale za 14,3 miliarda dolarów.

Ustawa Emmera o Przejrzystości Papierów Wartościo…
Waszyngton, D.C. – Wczoraj wieczorem ustawa Congressman’a Toma Emmera dotycząca przejrzystości w zakresie papierów wartościowych, wraz z częściami ustawodawstwa Blockchain Regulatory Certainty Act (BRCA), pomyślnie przeprowadziła etap redakcyjny w Komisji Usług Finansowych Izby Reprezentantów po włączeniu do ustawy CLARITY.

Rząd Wielkiej Brytanii rozwija narzędzie AI, któr…
Rząd Wielkiej Brytanii podejmuje znaczne wysiłki, aby zwiększyć wydajność sektora publicznego poprzez wykorzystanie technologii sztucznej inteligencji.

ICE chce więcej technologii analityki blockchain
Imigracja i Służba Celna (ICE) zwiększa swoje inwestycje w technologię analizy blockchain, równocześnie korzystając z innych platform śledczych.

Nieprzewidywalne zachowanie modeli językowych AI …
Wydanie newslettera Axios AM z dnia 9 czerwca 2025 roku podkreśla rosnące obawy związane z zaawansowanymi dużymi modelami językowymi (LLMs) w sztucznej inteligencji.