Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Jan. 23, 2025, 11:01 p.m.
261

DeepSeek-R1: Kosztowo efektywny chiński model AI, który konkuruje z o1 OpenAI

Duży model językowy opracowany w Chinach, znany jako DeepSeek-R1, budzi ekscytację wśród naukowców jako opłacalna i otwarta alternatywa dla modeli rozumowania, takich jak o1 od OpenAI. Modele te produkują odpowiedzi w sekwencji, która naśladuje ludzkie rozumowanie, co czyni je bardziej uzdolnionymi niż starsze modele językowe w radzeniu sobie z problemami naukowymi, co potencjalnie może być korzystne dla badań. Wczesne oceny R1, które zadebiutowało 20 stycznia, wskazują, że jego wydajność w zadaniach związanych z chemią, matematyką i kodowaniem dorównuje o1— które zaimponowało badaczom po swoim wydaniu przez OpenAI we wrześniu. „To jest zdumiewające i całkowicie nieoczekiwane, ” skomentował Elvis Saravia, badacz AI i współzałożyciel brytyjskiej firmy doradczej AI DAIR. AI, na platformie X. R1 jest godne uwagi z innego powodu. Start-up DeepSeek z siedzibą w Hangzhou uczynił model „otwartym wagowym”, co pozwala badaczom na analizowanie i ulepszanie algorytmu. Został opublikowany na licencji MIT, co umożliwia swobodne wykorzystanie, chociaż nie jest w pełni otwartym źródłem, ponieważ dane szkoleniowe pozostają nieujawnione. „Przejrzystość pokazana przez DeepSeek jest niezwykła, ” zauważa Mario Krenn, szef Laboratorium Sztucznego Naukowca w Instytucie Maxa Plancka ds. Nauki Światła w Erlangen, w Niemczech. W przeciwieństwie do o1 i innych modeli OpenAI z San Francisco, w tym niedawnego o3, uznawane są za „praktycznie czarne skrzynki, ” podkreśla. Chociaż halucynacje AI nie mogą być całkowicie wyeliminowane, niektóre techniki mogą pomóc w złagodzeniu ich skutków. DeepSeek nie ujawnili całkowitych kosztów szkolenia R1, ale pobierają od użytkowników około jednej trzydziestej wydatków operacyjnych o1.

Firma opracowała także mini „destylowane” wersje R1, umożliwiając badaczom z ograniczonymi zasobami obliczeniowymi eksperymentowanie z modelem. Krenn zauważa, „Eksperyment, który kosztował ponad 300 funtów z o1, kosztował mniej niż 10 dolarów z R1, ” podkreślając znaczącą różnicę, która może wpłynąć na przyszłe przyjęcie. R1 jest częścią wzrostu w chińskich dużych modelach językowych (LLM). Pochodzący z funduszu hedgingowego, DeepSeek zyskał uznanie w zeszłym miesiącu dzięki wydaniu chatbota o nazwie V3, który przewyższył głównych konkurentów pomimo ograniczonego budżetu. Eksperci szacują, że wynajem sprzętu do szkolenia modelu wyniósł około 6 milionów dolarów, w porównaniu do ponad 60 milionów dolarów za Llama 3. 1 405B od Meta, które wykorzystało 11 razy więcej zasobów obliczeniowych. Ekscytacja wokół DeepSeek częściowo wynika z jego osiągnięcia w opracowaniu R1 mimo amerykańskich ograniczeń eksportowych ograniczających dostęp chińskich firm do najlepszych chipów przetwarzania AI. „Fakt, że pochodzi z Chin, pokazuje, że efektywne zarządzanie zasobami jest ważniejsze niż czysta moc obliczeniowa, ” twierdzi François Chollet, badacz AI z siedzibą w Seattle, w stanie Waszyngton. Postępy DeepSeek wskazują, że „przepaść wcześniej postrzegana jako przewaga USA znacznie się zmniejszyła, ” zauważył Alvin Wang Graylin, ekspert technologiczny z Bellevue, w stanie Waszyngton, związany z tajwańską firmą technologiczną HTC, na platformie X. „Oba kraje powinny rozważyć strategię współpracy w rozwoju zaawansowanej AI, zamiast kontynuowania obecnego bezsensownego wyścigu zbrojeń. ”



Brief news summary

Model językowy DeepSeek-R1, opracowany przez chiński startup, przyciąga znaczną uwagę ze względu na swoją efektywność kosztową w porównaniu do modeli OpenAI. Wstępne analizy ujawniają imponujące możliwości R1 w takich dziedzinach jak chemia, matematyka i programowanie, a badacz Elvis Saravia zauważa jego „dzikie i całkowicie nieoczekiwane” zdolności. Co istotne, DeepSeek stosuje system „otwartych wag”, który zachęca do współpracy i doskonalenia algorytmów wśród badaczy, w przeciwieństwie do zastrzeżonych metod OpenAI. Ponadto R1 działa przy kosztach około jednej trzydziestej kosztów rozwiązań OpenAI, co umożliwia bardziej przystępne opcje testowe. Ten rozwój odzwierciedla szybki postęp w chińskim sektorze modeli językowych, nawet w obliczu amerykańskich ograniczeń dotyczących eksportu technologii AI. Eksperci wskazują, że efektywność R1 reprezentuje trend w kierunku optymalizacji zasobów, a nie tylko zwiększania mocy obliczeniowej, sugerując zmniejszającą się technologiczną przepaść między USA a Chinami. Postęp ten może sprzyjać możliwościom współpracy w dziedzinie AI, wykraczając poza konwencjonalne dynamiki konkurencyjne.
Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Content Maker

Our unique Content Maker allows you to create an SEO article, social media posts, and a video based on the information presented in the article

news image

Last news

The Best for your Business

Learn how AI can help your business.
Let’s talk!

June 22, 2025, 2:14 p.m.

Zerohash rozwija ekosystem blockchain dzięki inte…

Chicago, 19 czerwca 2025 r.

June 22, 2025, 2:11 p.m.

Modele sztucznej inteligencji w symulacjach wykaz…

Niedawne badania firmy Anthropic, czołowego przedsiębiorstwa zajmującego się badaniami nad sztuczną inteligencją, podniosły poważne kwestie etyczne dotyczące zachowania i podejmowania decyzji przez modele AI.

June 22, 2025, 10:19 a.m.

Wyoming ogłasza 11 finalistów blockchainowych w k…

Wyoming przygotowuje się do uruchomienia własnej stablecoina WYST tego lata i ujawniło listę 11 finalnych kandydatów na blockchain.

June 22, 2025, 10:13 a.m.

Inwestycja Meta w Scale AI o wartości 14 miliardó…

Meta dokonała ważnego posunięcia strategicznego, nabywając 49% udziałów w Scale AI, wiodącej firmy specjalizującej się w etykietowaniu danych dla sztucznej inteligencji.

June 22, 2025, 6:40 a.m.

Mantle uruchamia UR, pierwszą na świecie w pełni …

Singapur, 18 czerwca 2025, Chainwire – Mantle, innowacyjny ekosystem on-chain z ponad 3 miliardami dolarów w Locked Total Value (TVL), ogłosił dziś uruchomienie UR, banku działającego na blockchainie, zaprojektowanego w celu eliminacji tarcia między tradycyjnymi finansami (TradFi) a zdecentralizowanymi finansami (DeFi).

June 22, 2025, 6:21 a.m.

Papież Leo mówi o wpływie sztucznej inteligencji …

Podczas międzynarodowego wydarzenia, w którym wzięło udział 68 delegacji parlamentarnych oraz włoska premier Giorgia Meloni, Papież Leon przemówił na temat narastających wyzwań związanych ze sztuczną inteligencją (AI).

June 21, 2025, 2:35 p.m.

Sztuczna inteligencja i blockchain napędzają star…

Rynek płatności szybko ewoluuje, a liczne startupy prowadzą innowacje, które przekształcają sektor bankowy, szczególnie w nowych obszarach takich jak stablecoiny i sztuczna inteligencja (AI).

All news