lang icon En
Jan. 23, 2025, 11:01 p.m.
4010

DeepSeek-R1: Kustannustehokas kiinalainen tekoälymalli kilpailee OpenAI:n o1:n kanssa

Brief news summary

DeepSeek-R1-kielimalli, joka on kehitetty kiinalaisen startupin toimesta, herättää merkittävää kiinnostusta sen kustannustehokkuuden vuoksi verrattuna OpenAI:n malleihin. Alustavat analyysit paljastavat R1:n vaikuttavat kyvyt kemian, matematiikan ja ohjelmoinnin aloilla, ja tutkija Elvis Saravia huomauttaa sen "villistä ja täysin odottamattomasta" osaamisesta. Huomionarvoista on, että DeepSeek käyttää "avoin painotus" -järjestelmää, joka rohkaisee yhteistyöhön ja algoritmien parantamiseen tutkijoiden kesken, toisin kuin OpenAI:n yksityiset menetelmät. Lisäksi R1 toimii noin kolmanneksella OpenAI:n tarjousten kustannuksista, mikä mahdollistaa edullisempia testausvaihtoehtoja. Tämä kehitys heijastaa nopeita edistysaskeleita Kiinan kielimallialalla, vaikka Yhdysvalloilla on rajoituksia tekoälyteknologian viennissä. Asiantuntijat osoittavat, että R1:n tehokkuus edustaa suuntausta kohti resurssien optimointia eikä pelkästään laskentatehon parantamista, mikä viittaa teknologisen kuilun kaventumiseen Yhdysvaltojen ja Kiinan välillä. Tämä edistys voi luoda mahdollisuuksia yhteistyölle tekoälyalalla, siirtyen perinteisten kilpailudynamiikkojen ohi.

Kiinalainen suuri kielimalli, joka tunnetaan nimellä DeepSeek-R1, herättää tiedemiesten mielenkiintoa kustannustehokkaana ja avoimena vaihtoehtona järkeilymalleille, kuten OpenAI:n o1:lle. Nämä mallit tuottavat vastauksia järjestyksessä, joka jäljittelee inhimillistä järkeilyä, mikä tekee niistä taitavampia kuin vanhemmat kielimallit tieteellisten ongelmien ratkaisemisessa, mikä voi olla hyödyllistä tutkimuksessa. R1:n, joka julkaistiin 20. tammikuuta, alkuarviot viittaavat siihen, että sen suorituskyky kemian, matematiikan ja ohjelmoinnin tehtävissä on kilpailukykyinen o1:n kanssa — joka vaikutti tutkijoihin sen julkaisuhetkellä OpenAI:lta syyskuussa. “Tämä on hämmästyttävää ja täysin odottamatonta, ” kommentoi Elvis Saravia, AI-tutkija ja Iso-Britanniassa toimivan AI-konsulttiyrityksen DAIR. AI:n co-founder, X:ssä. R1:llä on merkittävää muitakin syitä. Hangzhoussa sijaitseva start-up DeepSeek on tehnyt mallista 'avoin paino', mikä mahdollistaa tutkijoiden analysoida ja parantaa algoritmia. Se on julkaistu MIT-lisenssin alla, mikä mahdollistaa ilmaisen uudelleenkäytön, vaikka se ei ole täysin avoin lähdekoodi, koska koulutusdata on salattu. “DeepSeekin osoittama läpinäkyvyys on huomionarvoista, ” toteaa Mario Krenn, Max Planck -instituutin valontutkimuslaboratorion johtaja Erlangenissa, Saksassa. Ottaen huomioon, että o1 ja muut OpenAI:n mallit San Franciscossa, mukaan lukien uusi o3, ovat “periaatteessa mustia laatikoita, ” hän huomauttaa. Vaikka AI-harhaluuloja ei voida täysin eliminoida, tietyt tekniikat voivat auttaa vähentämään niiden vaikutuksia. DeepSeek ei ole paljastanut R1:n koulutuksen kokonaiskustannuksia, mutta se veloittaa käyttäjiltä noin kolmanneksen o1:n toimintakuluista.

Yritys on myös kehittänyt pienempiä ‘tislattuja’ versioita R1:stä, mikä mahdollistaa rajoitettujen laskentatehojen tutkijakokeet mallin kanssa. Krenn huomauttaa: “Koe, joka maksoi yli 300 puntaa o1:llä, maksoi R1:llä alle 10 dollaria, ” mikä korostaa merkittävää eroa, joka voisi vaikuttaa tulevaan hyväksymiseen. R1 on osa kiinalaisten suurten kielimallien (LLM) nousua. Hedge fundista syntynyt DeepSeek sai viime kuussa huomiota julkaistuaan V3-nimisen chatbotin, joka ylitti merkittävät kilpailijat huolimatta rajallisesta budjetista. Asiantuntijat arvioivat, että mallin koulutuksen laitteistovuokra oli noin 6 miljoonaa dollaria, verrattuna yli 60 miljoonaan dollariin Metan Llama 3. 1 405B:lle, joka käytti 11 kertaa enemmän laskentatehoja. DeepSeekin ympärillä oleva innostus johtuu osittain sen saavutuksesta kehittää R1 Yhdysvaltojen vientirajoitusten keskellä, jotka rajoittavat kiinalaisten yritysten pääsyä huipputason AI-prosessointisiruisiin. “Se, että se on peräisin Kiinasta, osoittaa, että tehokas resurssinhallinta on tärkeämpää kuin pelkkä laskentateho, ” väittää Seattleissa, Washingtonissa toimiva AI-tutkija François Chollet. DeepSeekin edistysaskeleet viittaavat siihen, että “kuilu, jota aiemmin pidettiin Yhdysvaltojen etuna, on merkittävästi kaventunut, ” huomautti Alvin Wang Graylin, tech-asiantuntija Bellevue'ssa, Washingtonissa, joka on yhteydessä Taiwanissa toimivaan immersiiviseen teknologiaan erikoistuneeseen HTC:hen, X:ssä. “Molempien maiden tulisi harkita yhteistyöstrategiaa edistyksellisen AI:n kehittämiseksi sen sijaan, että ne jatkaisivat nykyistä turhaa asevarustelukilpailua. ”


Watch video about

DeepSeek-R1: Kustannustehokas kiinalainen tekoälymalli kilpailee OpenAI:n o1:n kanssa

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 19, 2025, 1:28 p.m.

Z.ai:n nopea kasvu ja kansainvälinen laajentumine…

Z.ai, joka tunnettiin aiemmin nimellä Zhipu AI, on johtava kiinalainen teknologiayritys, joka erikoistuu tekoälyyn.

Dec. 19, 2025, 1:27 p.m.

Tulevaisuuden ja nykytilan tekoälyn rooli myynnis…

Jason Lemkin johti siemenrahoituskierroksen SaaStr Fundin kautta unicorn Owner.com -alustassa, joka on tekoälypohjainen alusta, muuttaen pienten ravintoloiden toimintatapoja.

Dec. 19, 2025, 1:25 p.m.

Miksi olen eri mieltä tekoälyn kanssa vuoden 2026…

Vuosi 2025 oli tekoälyn hallitsema, ja vuonna 2026 seuraa sama linjaus, sillä digitaalinen älykkyys nousee suurimmaksi häiriötekijäksi mediassa, markkinoinnissa ja mainonnassa.

Dec. 19, 2025, 1:23 p.m.

Tekoälyn videokoodausmenetelmät parantavat suorat…

Tekoäly (AI) muokkaa merkittävästi tapaa, jolla videopitoja tarjotaan ja koetaan, erityisesti videokompression alalla.

Dec. 19, 2025, 1:19 p.m.

tekoälyn hyödyntäminen paikallisessa hakukoneopti…

Paikallinen hakukoneoptimointi on nyt ratkaisevan tärkeää yrityksille, jotka pyrkivät houkuttelemaan ja säilyttämään asiakkaita läheisessä maantieteellisessä alueessaan.

Dec. 19, 2025, 1:15 p.m.

Adobe käynnistää edistyneet tekoälyvälittäjät mul…

Adobe on esitellyt uuden tekoälyagenttien (AI) sarjan, jotka on suunniteltu auttamaan brändejä parantamaan asiakasvuorovaikutusta heidän verkkosivustoillaan.

Dec. 19, 2025, 9:32 a.m.

Markkinapaikan tiivistelmä: Kuinka Amazon-myyjät …

Amazonin julkinen ohjeistus Rufuksen, sen tekoälypohjaisen ostosavustajan, tuotteiden mainintojen optimoinnista pysyy muuttumattomana, eikä uusia neuvoja ole tarjottu myyjille.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today