Kiinalainen suuri kielimalli, joka tunnetaan nimellä DeepSeek-R1, herättää tiedemiesten mielenkiintoa kustannustehokkaana ja avoimena vaihtoehtona järkeilymalleille, kuten OpenAI:n o1:lle. Nämä mallit tuottavat vastauksia järjestyksessä, joka jäljittelee inhimillistä järkeilyä, mikä tekee niistä taitavampia kuin vanhemmat kielimallit tieteellisten ongelmien ratkaisemisessa, mikä voi olla hyödyllistä tutkimuksessa. R1:n, joka julkaistiin 20. tammikuuta, alkuarviot viittaavat siihen, että sen suorituskyky kemian, matematiikan ja ohjelmoinnin tehtävissä on kilpailukykyinen o1:n kanssa — joka vaikutti tutkijoihin sen julkaisuhetkellä OpenAI:lta syyskuussa. “Tämä on hämmästyttävää ja täysin odottamatonta, ” kommentoi Elvis Saravia, AI-tutkija ja Iso-Britanniassa toimivan AI-konsulttiyrityksen DAIR. AI:n co-founder, X:ssä. R1:llä on merkittävää muitakin syitä. Hangzhoussa sijaitseva start-up DeepSeek on tehnyt mallista 'avoin paino', mikä mahdollistaa tutkijoiden analysoida ja parantaa algoritmia. Se on julkaistu MIT-lisenssin alla, mikä mahdollistaa ilmaisen uudelleenkäytön, vaikka se ei ole täysin avoin lähdekoodi, koska koulutusdata on salattu. “DeepSeekin osoittama läpinäkyvyys on huomionarvoista, ” toteaa Mario Krenn, Max Planck -instituutin valontutkimuslaboratorion johtaja Erlangenissa, Saksassa. Ottaen huomioon, että o1 ja muut OpenAI:n mallit San Franciscossa, mukaan lukien uusi o3, ovat “periaatteessa mustia laatikoita, ” hän huomauttaa. Vaikka AI-harhaluuloja ei voida täysin eliminoida, tietyt tekniikat voivat auttaa vähentämään niiden vaikutuksia. DeepSeek ei ole paljastanut R1:n koulutuksen kokonaiskustannuksia, mutta se veloittaa käyttäjiltä noin kolmanneksen o1:n toimintakuluista.
Yritys on myös kehittänyt pienempiä ‘tislattuja’ versioita R1:stä, mikä mahdollistaa rajoitettujen laskentatehojen tutkijakokeet mallin kanssa. Krenn huomauttaa: “Koe, joka maksoi yli 300 puntaa o1:llä, maksoi R1:llä alle 10 dollaria, ” mikä korostaa merkittävää eroa, joka voisi vaikuttaa tulevaan hyväksymiseen. R1 on osa kiinalaisten suurten kielimallien (LLM) nousua. Hedge fundista syntynyt DeepSeek sai viime kuussa huomiota julkaistuaan V3-nimisen chatbotin, joka ylitti merkittävät kilpailijat huolimatta rajallisesta budjetista. Asiantuntijat arvioivat, että mallin koulutuksen laitteistovuokra oli noin 6 miljoonaa dollaria, verrattuna yli 60 miljoonaan dollariin Metan Llama 3. 1 405B:lle, joka käytti 11 kertaa enemmän laskentatehoja. DeepSeekin ympärillä oleva innostus johtuu osittain sen saavutuksesta kehittää R1 Yhdysvaltojen vientirajoitusten keskellä, jotka rajoittavat kiinalaisten yritysten pääsyä huipputason AI-prosessointisiruisiin. “Se, että se on peräisin Kiinasta, osoittaa, että tehokas resurssinhallinta on tärkeämpää kuin pelkkä laskentateho, ” väittää Seattleissa, Washingtonissa toimiva AI-tutkija François Chollet. DeepSeekin edistysaskeleet viittaavat siihen, että “kuilu, jota aiemmin pidettiin Yhdysvaltojen etuna, on merkittävästi kaventunut, ” huomautti Alvin Wang Graylin, tech-asiantuntija Bellevue'ssa, Washingtonissa, joka on yhteydessä Taiwanissa toimivaan immersiiviseen teknologiaan erikoistuneeseen HTC:hen, X:ssä. “Molempien maiden tulisi harkita yhteistyöstrategiaa edistyksellisen AI:n kehittämiseksi sen sijaan, että ne jatkaisivat nykyistä turhaa asevarustelukilpailua. ”
DeepSeek-R1: Kustannustehokas kiinalainen tekoälymalli kilpailee OpenAI:n o1:n kanssa
Z.ai, joka tunnettiin aiemmin nimellä Zhipu AI, on johtava kiinalainen teknologiayritys, joka erikoistuu tekoälyyn.
Jason Lemkin johti siemenrahoituskierroksen SaaStr Fundin kautta unicorn Owner.com -alustassa, joka on tekoälypohjainen alusta, muuttaen pienten ravintoloiden toimintatapoja.
Vuosi 2025 oli tekoälyn hallitsema, ja vuonna 2026 seuraa sama linjaus, sillä digitaalinen älykkyys nousee suurimmaksi häiriötekijäksi mediassa, markkinoinnissa ja mainonnassa.
Tekoäly (AI) muokkaa merkittävästi tapaa, jolla videopitoja tarjotaan ja koetaan, erityisesti videokompression alalla.
Paikallinen hakukoneoptimointi on nyt ratkaisevan tärkeää yrityksille, jotka pyrkivät houkuttelemaan ja säilyttämään asiakkaita läheisessä maantieteellisessä alueessaan.
Adobe on esitellyt uuden tekoälyagenttien (AI) sarjan, jotka on suunniteltu auttamaan brändejä parantamaan asiakasvuorovaikutusta heidän verkkosivustoillaan.
Amazonin julkinen ohjeistus Rufuksen, sen tekoälypohjaisen ostosavustajan, tuotteiden mainintojen optimoinnista pysyy muuttumattomana, eikä uusia neuvoja ole tarjottu myyjille.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today