lang icon En
Jan. 25, 2025, 11:13 a.m.
4465

DeepSeek käynnistää mullistavan avoimen lähdekoodin tekoälymallin, joka ylittää Yhdysvaltojen kilpailijat.

Brief news summary

20. tammikuuta kiinalainen tekoäylaboratorio DeepSeek julkaisi avoimen lähdekoodin mallinsa, DeepSeek-R1, joka on saanut kiitosta Piilaaksossa poikkeuksellisista matemaattisista ja päättelytaidoistaan, ylittäen vakiintuneet kilpailijat kuten OpenAI:n. Tämä julkaisu tapahtuu Yhdysvaltojen ja Kiinan teknologisten jännitteiden kasvaessa, mikä ilmenee vientirajoituksina, jotka vaikeuttavat Kiinan pääsyä kehittyneisiin teknologioihin. Vastauksena tähän DeepSeek korostaa ohjelmiston optimointia ja avoimen lähdekoodin aloitteita osoituksena innovaatio-kyvyistään. Liang Wenfengin perustama High-Flyer hedge-rahastosta, DeepSeek keskittyy pitkäaikaiseen tutkimukseen sen sijaan, että tavoittelisi lyhyen aikavälin voittoja. Sen tiimi koostuu tuoreista tohtoreista, jotka edistävät yhteistyöympäristöä, mikä erottuu monien teknologia-alan yhtiöiden vallitsevasta kilpailuhenkisyydestä. Vastaamalla Yhdysvaltojen rajoituksiin huipputason siruista, kuten Nvidian H100:sta, DeepSeek on kehittänyt mallinsa arkkitehtuuria tehokkaampaa koulutusta varten. Hyödyntäen strategioita kuten monikärkinen piilotettu huomio ja asiantuntijatehosteet, DeepSeekin malli toimii merkittävästi vähentyneillä laskentatehoilla verrattuna kilpailijoihinsa. Tämä strateginen sopeutuminen mahdollistaa DeepSeekin AI:n kehittämisen Kiinassa huolimatta jatkuvista vient haasteista.

Tammikuun 20. päivänä DeepSeek, vähemmän tunnettu tekoälytutkimuslaboratorio Kiinasta, julkaisi avoimen lähdekoodin mallin, joka sai nopeasti huomiota Piilaaksossa. Yhtiön julkaisu väittää, että DeepSeek-R1 ylittää johtavat mallit, kuten OpenAI:n, useissa matematiikka- ja päättelymittareissa, osoittaen merkittäviä kykyjä alhaisemmalla kustannuksella ja painottaen avointa lähestymistapaa. DeepSeekin menestys havainnollistaa uutta suuntaa kiinalaisille teknologiayrityksille teknologisen kylmän sodan keskellä; Yhdysvaltojen vientirajoitusten vuoksi monet ovat siirtyneet ylävirran mallinrakentamisesta alavirtahakemuksiin. DeepSeek on kuitenkin keskittynyt tekoälymallirakenteiden optimointiin ja resurssien tehokkaaseen käyttöön. Liang Wenfengin, tietojenkäsittelytieteen maisterin, perustama DeepSeek syntyi High-Flyerista, tunnetusta kvantitatiiviasta hedge-rahastosta, joka alun perin keskittyi syväoppimiseen. Hedge-rahasto keräsi resursseja tekoälykehitykseen, mikä johti DeepSeekin perustamiseen ja heijastaa siirtymistä kohti pitkäntähtäimen teknologisia tavoitteita ennemmin kuin välitöntä voittoa.

Liang totesi, että tieteellinen uteliaisuus ohjasi tätä hanketta, korostaen keskittymistä perustavanlaatuisten tekoälytutkimusten edistämiseen kaupallisten sovellusten sijaan. DeepSeekin tiimi koostuu pääasiassa äskettäin väitelleistä tohtoreista, jotka ovat valmistuneet huipputason kiinalaisista yliopistoista, edistäen yhteistyöhön perustuvaa ympäristöä, joka keskittyy uraauurtavaan tutkimukseen. Tämä lähestymistapa poikkeaa vakiintuneiden kiinalaisten teknologiayritysten käytännöistä, joissa kilpailu resursseista usein estää innovaatioita. Liang huomauttaa, että nuoret tutkijat sopivat paremmin suuret investoinnit vaativiin projekteihin heidän sitoutumisensa ja utilitarististen pohdintojensa puutteen vuoksi. Yritys kohtaa haasteita Yhdysvaltojen hallituksen vientivalvontatoimista, jotka rajoittavat pääsyä edistyneisiin tekoälyprosessoripiireihin. Aluksi 10 000 Nvidia H100 -sirun varastolla varustetun DeepSeekin kyky kilpailla edellytti tehokkaampia mallin koulutusmenetelmiä. Tiimi toteutti insinööri strategioita ja innovatiivisia suunnitelmia, kuten Multi-head Latent Attention (MLA) ja Mixture-of-Experts, vähentäen merkittävästi laskentatehoa, jota heidän viimeisimmän mallinsa kouluttaminen vaati verrattuna Metan Llama 3. 1:een. DeepSeekin avoin lähestymistapa on herättänyt hyvää tahtoa globaalissa tekoälytutkimusyhteisössä, mikä on mahdollistanut osallistujien ja käyttäjien houkuttelemisen, jotka ovat tarpeen mallien parantamiseksi. Tämä muutos nykyisessä tekoälyn kentässä voi haastaa nykyisten Yhdysvaltojen vientivalvontatoimien tehokkuuden osoittamalla, että huipputason malleja voidaan kehittää optimoidun resurssien käytön avulla, mikä voi johtaa mahdollisiin muutoksiin käsityksissä kiinalaisista tekoälykyvyistä.


Watch video about

DeepSeek käynnistää mullistavan avoimen lähdekoodin tekoälymallin, joka ylittää Yhdysvaltojen kilpailijat.

Try our premium solution and start getting clients — at no cost to you

I'm your Content Creator.
Let’s make a post or video and publish it on any social media — ready?

Language

Hot news

Dec. 18, 2025, 9:34 a.m.

Tekoälyvoimaiset videonmuokkaustyökalut mullistav…

Tekoälyteknologia mullistaa videon sisällöntuotantoa pääasiassa AI-tehostettujen videoeditointityökalujen nousun myötä.

Dec. 18, 2025, 9:27 a.m.

Liverpool varmistaa AI-markkinoinnin automaatioku…

Joulukuu 18.

Dec. 18, 2025, 9:25 a.m.

Tekoälyn hyödyntäminen tehokkaassa hakukoneoptimo…

Kun tekoäly (AI) kehittyy ja integroituvat yhä enemmän digitaalisen markkinoinnin eri osa-alueisiin, sen vaikutus hakukoneoptimointiin (SEO) on kasvanut merkittävästi.

Dec. 18, 2025, 9:18 a.m.

TD Synnex käynnistää "AI-pelisunnitelma" -työpaja…

TD Synnex on lanseerannut 'AI Game Plan' -työpajan, innovatiivisen ja kattavan työpajan, jonka tarkoitus on auttaa yhteistyökumppaneitaan ohjaamaan asiakkaita strategisessa tekoälyn käyttöönotossa.

Dec. 18, 2025, 9:17 a.m.

Applen Sirin tekoäly: Nyt tarjoamassa personoituj…

Apple on julkaissut päivitetyn version Siristä, sen ääniohjauksella toimivasta virtuaaliassistentista, joka nyt tarjoaa henkilökohtaisia suosituksia räätälöitynä kunkin käyttäjän käyttäytymisen ja mieltymysten mukaan.

Dec. 18, 2025, 9:15 a.m.

Tekoäly markkinoinnissa vuonna 2025: Suuntaukset,…

Markkinoijat käyttävät yhä enemmän tekoälyä työnkulkujen virtaviivistämiseen, sisällön laadun parantamiseen ja ajan säästämiseen.

Dec. 18, 2025, 5:29 a.m.

Amazon uudelleenjärjestelee tekoälyosastonsa joht…

Amazon käy läpi suuria muutoksia tekoälyosastollaan, jotka korostuvat pitkäaikaisen veteraanin lähdön ja uuden johtajiston nimittämisen myötä, tarkoituksenaan valvoa laajempaa valikoimaa tekoälyhankkeita.

All news

AI Company

Launch your AI-powered team to automate Marketing, Sales & Growth

and get clients on autopilot — from social media and search engines. No ads needed

Begin getting your first leads today