News
>
DeepSeek-R1: Kosztowo efektywny chiński model AI, który konkuruje z o1 OpenAI

Auto-Filling SEO Website as a Gift

Launch Your AI-Powered Business and get clients!

No advertising investment needed—just results. AI finds, negotiates, and closes deals automatically

Jan. 23, 2025, 11:01 p.m.

261

DeepSeek-R1: Kosztowo efektywny chiński model AI, który konkuruje z o1 OpenAI

Duży model językowy opracowany w Chinach, znany jako DeepSeek-R1, budzi ekscytację wśród naukowców jako opłacalna i otwarta alternatywa dla modeli rozumowania, takich jak o1 od OpenAI. Modele te produkują odpowiedzi w sekwencji, która naśladuje ludzkie rozumowanie, co czyni je bardziej uzdolnionymi niż starsze modele językowe w radzeniu sobie z problemami naukowymi, co potencjalnie może być korzystne dla badań. Wczesne oceny R1, które zadebiutowało 20 stycznia, wskazują, że jego wydajność w zadaniach związanych z chemią, matematyką i kodowaniem dorównuje o1— które zaimponowało badaczom po swoim wydaniu przez OpenAI we wrześniu. „To jest zdumiewające i całkowicie nieoczekiwane, ” skomentował Elvis Saravia, badacz AI i współzałożyciel brytyjskiej firmy doradczej AI DAIR. AI, na platformie X. R1 jest godne uwagi z innego powodu. Start-up DeepSeek z siedzibą w Hangzhou uczynił model „otwartym wagowym”, co pozwala badaczom na analizowanie i ulepszanie algorytmu. Został opublikowany na licencji MIT, co umożliwia swobodne wykorzystanie, chociaż nie jest w pełni otwartym źródłem, ponieważ dane szkoleniowe pozostają nieujawnione. „Przejrzystość pokazana przez DeepSeek jest niezwykła, ” zauważa Mario Krenn, szef Laboratorium Sztucznego Naukowca w Instytucie Maxa Plancka ds. Nauki Światła w Erlangen, w Niemczech. W przeciwieństwie do o1 i innych modeli OpenAI z San Francisco, w tym niedawnego o3, uznawane są za „praktycznie czarne skrzynki, ” podkreśla. Chociaż halucynacje AI nie mogą być całkowicie wyeliminowane, niektóre techniki mogą pomóc w złagodzeniu ich skutków. DeepSeek nie ujawnili całkowitych kosztów szkolenia R1, ale pobierają od użytkowników około jednej trzydziestej wydatków operacyjnych o1.

Firma opracowała także mini „destylowane” wersje R1, umożliwiając badaczom z ograniczonymi zasobami obliczeniowymi eksperymentowanie z modelem. Krenn zauważa, „Eksperyment, który kosztował ponad 300 funtów z o1, kosztował mniej niż 10 dolarów z R1, ” podkreślając znaczącą różnicę, która może wpłynąć na przyszłe przyjęcie. R1 jest częścią wzrostu w chińskich dużych modelach językowych (LLM). Pochodzący z funduszu hedgingowego, DeepSeek zyskał uznanie w zeszłym miesiącu dzięki wydaniu chatbota o nazwie V3, który przewyższył głównych konkurentów pomimo ograniczonego budżetu. Eksperci szacują, że wynajem sprzętu do szkolenia modelu wyniósł około 6 milionów dolarów, w porównaniu do ponad 60 milionów dolarów za Llama 3. 1 405B od Meta, które wykorzystało 11 razy więcej zasobów obliczeniowych. Ekscytacja wokół DeepSeek częściowo wynika z jego osiągnięcia w opracowaniu R1 mimo amerykańskich ograniczeń eksportowych ograniczających dostęp chińskich firm do najlepszych chipów przetwarzania AI. „Fakt, że pochodzi z Chin, pokazuje, że efektywne zarządzanie zasobami jest ważniejsze niż czysta moc obliczeniowa, ” twierdzi François Chollet, badacz AI z siedzibą w Seattle, w stanie Waszyngton. Postępy DeepSeek wskazują, że „przepaść wcześniej postrzegana jako przewaga USA znacznie się zmniejszyła, ” zauważył Alvin Wang Graylin, ekspert technologiczny z Bellevue, w stanie Waszyngton, związany z tajwańską firmą technologiczną HTC, na platformie X. „Oba kraje powinny rozważyć strategię współpracy w rozwoju zaawansowanej AI, zamiast kontynuowania obecnego bezsensownego wyścigu zbrojeń. ”

News source

Brief news summary

Model językowy DeepSeek-R1, opracowany przez chiński startup, przyciąga znaczną uwagę ze względu na swoją efektywność kosztową w porównaniu do modeli OpenAI. Wstępne analizy ujawniają imponujące możliwości R1 w takich dziedzinach jak chemia, matematyka i programowanie, a badacz Elvis Saravia zauważa jego „dzikie i całkowicie nieoczekiwane” zdolności. Co istotne, DeepSeek stosuje system „otwartych wag”, który zachęca do współpracy i doskonalenia algorytmów wśród badaczy, w przeciwieństwie do zastrzeżonych metod OpenAI. Ponadto R1 działa przy kosztach około jednej trzydziestej kosztów rozwiązań OpenAI, co umożliwia bardziej przystępne opcje testowe. Ten rozwój odzwierciedla szybki postęp w chińskim sektorze modeli językowych, nawet w obliczu amerykańskich ograniczeń dotyczących eksportu technologii AI. Eksperci wskazują, że efektywność R1 reprezentuje trend w kierunku optymalizacji zasobów, a nie tylko zwiększania mocy obliczeniowej, sugerując zmniejszającą się technologiczną przepaść między USA a Chinami. Postęp ten może sprzyjać możliwościom współpracy w dziedzinie AI, wykraczając poza konwencjonalne dynamiki konkurencyjne.

Business on autopilot

AI-powered Lead Generation in Social Media
and Search Engines

Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment

Language

Learn how AI can help your business.
Let’s talk!

June 22, 2025, 2:14 p.m.

Zerohash rozwija ekosystem blockchain dzięki inte…

Chicago, 19 czerwca 2025 r.

June 22, 2025, 2:11 p.m.

Modele sztucznej inteligencji w symulacjach wykaz…

Niedawne badania firmy Anthropic, czołowego przedsiębiorstwa zajmującego się badaniami nad sztuczną inteligencją, podniosły poważne kwestie etyczne dotyczące zachowania i podejmowania decyzji przez modele AI.

June 22, 2025, 10:19 a.m.

Wyoming ogłasza 11 finalistów blockchainowych w k…

Wyoming przygotowuje się do uruchomienia własnej stablecoina WYST tego lata i ujawniło listę 11 finalnych kandydatów na blockchain.

June 22, 2025, 10:13 a.m.

Inwestycja Meta w Scale AI o wartości 14 miliardó…

Meta dokonała ważnego posunięcia strategicznego, nabywając 49% udziałów w Scale AI, wiodącej firmy specjalizującej się w etykietowaniu danych dla sztucznej inteligencji.

June 22, 2025, 6:40 a.m.

Mantle uruchamia UR, pierwszą na świecie w pełni …

Singapur, 18 czerwca 2025, Chainwire – Mantle, innowacyjny ekosystem on-chain z ponad 3 miliardami dolarów w Locked Total Value (TVL), ogłosił dziś uruchomienie UR, banku działającego na blockchainie, zaprojektowanego w celu eliminacji tarcia między tradycyjnymi finansami (TradFi) a zdecentralizowanymi finansami (DeFi).

June 22, 2025, 6:21 a.m.

Papież Leo mówi o wpływie sztucznej inteligencji …

Podczas międzynarodowego wydarzenia, w którym wzięło udział 68 delegacji parlamentarnych oraz włoska premier Giorgia Meloni, Papież Leon przemówił na temat narastających wyzwań związanych ze sztuczną inteligencją (AI).

June 21, 2025, 2:35 p.m.

Sztuczna inteligencja i blockchain napędzają star…

Rynek płatności szybko ewoluuje, a liczne startupy prowadzą innowacje, które przekształcają sektor bankowy, szczególnie w nowych obszarach takich jak stablecoiny i sztuczna inteligencja (AI).

All news

Launch Your AI-Powered Business and get clients!

DeepSeek-R1: Kosztowo efektywny chiński model AI, który konkuruje z o1 OpenAI

News source

Brief news summary

AI-powered Lead Generation in Social Media
and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Zerohash zapewnia pełne wsparcie dla DOT, USDC i USDT na blockchainie Polkadot dzięki integracji z Asset Hub

Badanie antropiczne ujawnia kluczowe ryzyko etyczne związane z zaawansowanym zachowaniem i podejmowaniem decyzji przez sztuczną inteligencję

Wyoming uruchomi stablecoin WYST: wśród finalistów znajdują się Aptos, Solana i Sei

The Best for your Business

Learn how AI can help your business.
Let’s talk!

Zerohash rozwija ekosystem blockchain dzięki inte…

Modele sztucznej inteligencji w symulacjach wykaz…

Wyoming ogłasza 11 finalistów blockchainowych w k…

Inwestycja Meta w Scale AI o wartości 14 miliardó…

Mantle uruchamia UR, pierwszą na świecie w pełni …

Papież Leo mówi o wpływie sztucznej inteligencji …

Sztuczna inteligencja i blockchain napędzają star…

Sales

Marketing

Customer Service

Launch Your AI-Powered Business and get clients!

DeepSeek-R1: Kosztowo efektywny chiński model AI, który konkuruje z o1 OpenAI

News source

Brief news summary

AI-powered Lead Generation in Social Media and Search Engines

I'm your Content Manager, ready to handle your first test assignment

Content Maker

Last news

Zerohash zapewnia pełne wsparcie dla DOT, USDC i USDT na blockchainie Polkadot dzięki integracji z Asset Hub

Badanie antropiczne ujawnia kluczowe ryzyko etyczne związane z zaawansowanym zachowaniem i podejmowaniem decyzji przez sztuczną inteligencję

Wyoming uruchomi stablecoin WYST: wśród finalistów znajdują się Aptos, Solana i Sei

The Best for your Business

Learn how AI can help your business. Let’s talk!

Zerohash rozwija ekosystem blockchain dzięki inte…

Modele sztucznej inteligencji w symulacjach wykaz…

Wyoming ogłasza 11 finalistów blockchainowych w k…

Inwestycja Meta w Scale AI o wartości 14 miliardó…

Mantle uruchamia UR, pierwszą na świecie w pełni …

Papież Leo mówi o wpływie sztucznej inteligencji …

Sztuczna inteligencja i blockchain napędzają star…

Your News is ready

Your article is ready

Generating video takes longer than text.

Join our community of experts

Reasons why you should be part of the experts community

Welcome to Neuron Expert!

Launch Your AI-Powered Business

Auto-Filling SEO Website as a Gift

AI Marketing Across All Social Media

AI Sales Manager + CRM

Support

Content Maker

Topic

Specify the topic (Optional)

Link (Optional)

Learn how to craft press releases, create unique social media posts, write SEO-optimized articles for websites, and produce videos, all from a single source

AI-powered Lead Generation in Social Media
and Search Engines

Learn how AI can help your business.
Let’s talk!