lang icon Polish
Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Dec. 27, 2024, 6:57 a.m.
259

Model V3 firmy DeepSeek przewyższa gigantów technologicznych dzięki innowacjom budżetowym.

Model DeepSeek V3 został opracowany w ciągu dwóch miesięcy za 5, 58 miliona USD, wykorzystując mniej zasobów obliczeniowych niż konkurenci. Czas czytania: 2 minuty Dlaczego możesz zaufać SCMP Relacjonuje Ben Jiang z Pekinu Opublikowano i zaktualizowano: 18:45, 27 grudnia 2024 DeepSeek, chiński start-up, wzbudził poruszenie w globalnym przemyśle AI swoim nowym dużym modelem językowym (LLM), który przewyższył modele od Meta Platforms i twórcy ChatGPT, OpenAI, w testach porównawczych. Firma z Hangzhou ogłosiła na WeChat w czwartek, że jej LLM, DeepSeek V3, ma 671 miliardów parametrów i został wytrenowany w ciągu około dwóch miesięcy za koszt 5, 58 miliona USD, używając wyraźnie mniej zasobów obliczeniowych niż te opracowane przez większe firmy technologiczne. LLM wspiera generatywne usługi AI jak ChatGPT, a wysoka liczba parametrów jest kluczowa do adaptacji do skomplikowanych wzorców danych i dokonywania precyzyjnych prognoz. Informatyk Andrej Karpathy, członek założyciel OpenAI, skomentował raport chińskiego start-upu o nowym modelu AI na platformie społecznościowej X, mówiąc: „DeepSeek sprawia, że to wygląda łatwo. . .

z udostępnieniem otwartych wag modelu LLM najwyższej klasy, wytrenowanego za śmieszny budżet. ” Otwarte wagi oznaczają jedynie udostępnienie wstępnie wytrenowanych parametrów lub wag modelu AI, co pozwala stronom trzecim korzystać z modelu do wnioskowania i doskonalenia, ale nie zapewnia kodu treningowego, oryginalnego zestawu danych, szczegółów architektury ani metodologii treningowej. Stworzenie przez DeepSeek mocnego LLM za budżet znacznie mniejszy niż zwykle inwestują większe firmy jak Meta i OpenAI podkreśla postęp osiągnięty przez chińskie firmy AI, mimo amerykańskich sankcji ograniczających ich dostęp do zaawansowanych półprzewodników niezbędnych do trenowania modeli.



Brief news summary

Chiński start-up DeepSeek zyskał rozgłos na globalnej scenie AI dzięki wprowadzeniu swojego nowego dużego modelu językowego (LLM), DeepSeek V3. Posiadający 671 miliardów parametrów model został wytrenowany w zaledwie dwa miesiące za kwotę 5,58 miliona USD. Pomimo użycia mniejszych zasobów obliczeniowych w porównaniu do gigantów takich jak Meta i OpenAI, DeepSeek V3 przewyższył konkurentów w testach porównawczych. Ten sukces ukazuje postępy chińskich firm AI, pomimo amerykańskich sankcji ograniczających dostęp do zaawansowanych półprzewodników. DeepSeek V3 jest kluczowy dla usług generatywnego AI dzięki swojej zdolności do zarządzania skomplikowanymi danymi i dostarczania precyzyjnych prognoz. Andrej Karpathy z OpenAI pochwalił efektywne podejście DeepSeek do treningu, zrealizowane poprzez udostępnianie jedynie wstępnie wytrenowanych wag, co pozwala innym korzystać z modelu bez ujawniania jego kodu treningowego lub zestawów danych. Ta innowacyjna strategia stanowi ważny krok dla chińskich firm AI na wysoce konkurencyjnym globalnym rynku.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

May 8, 2025, 10:05 p.m.

Próbowałem zobaczyć, jak będę się starzeć, korzys…

Nie ma nic bardziej atrakcyjnego niż ktoś, kto z gracją akceptuje swój wiek.

May 8, 2025, 9:52 p.m.

Podsumowanie rynku kryptowalut z dnia 5 maja 2025…

5 maja 2025 roku globalny rynek kryptowalut odnotował niewielki korektę, a jego łączna kapitalizacja wyniosła 2,94 biliona dolarów, co oznacza spadek o 1,3% w ciągu ostatnich 24 godzin.

May 8, 2025, 8:28 p.m.

Dyrektor generalny OpenAI Sam Altman oraz inni li…

8 maja 2025 roku.

May 8, 2025, 8:18 p.m.

Dlaczego Sei chce odciąć kompatybilność z Cosmos,…

Deweloper Sei Network zaproponował w środę deprecjonację wsparcia dla blockchaina Cosmos w celu wyeliminowania „niepotrzebnej” złożoności dla użytkowników.

May 8, 2025, 6:57 p.m.

Naukowcy wykorzystują analizę twarzy za pomocą sz…

Naukowcy stworzyli innowacyjne narzędzie oparte na sztucznej inteligencji o nazwie FaceAge, które analizuje cechy twarzy, aby przewidzieć wyniki przeżycia u pacjentów z chorobami nowotworowymi, często przewyższając dokładnością klinicystów.

May 8, 2025, 6:27 p.m.

Robinhood rozważa wprowadzenie Solany i Arbitrum …

Robinhood podobno rozwija infrastrukturę blockchain, mającą na celu umożliwienie europejskim inwestorom detalicznym handlu amerykańskimi papierami wartościowymi, według raportu Bloomberg News z 7 maja.

May 8, 2025, 5:27 p.m.

Anthropic szybko rozbuduje zespół ds. komunikacji

Anthropic, wiodący startup AI znany z dużego modelu językowego Claude, planuje potroić rozmiar swojego zespołu komunikacji do końca 2025 roku.

All news