Hiina laboratoorium on tutvustanud seni üht võimsamat "avatud" tehisintellekti mudelit, nimega DeepSeek V3. Selle on välja töötanud tehisintellekti firma DeepSeek ja see anti välja kolmapäeval leebe litsentsi alusel, mis võimaldab arendajatel seda alla laadida ja laiendada enamiku kasutusvõimaluste jaoks, kaasa arvatud kaubanduslikud rakendused. DeepSeek V3 paistab silma mitmesuguste tekstipõhiste ülesannete täitmisel, nagu kodeerimine, tõlkimine ja esseede ning e-kirjade kirjutamine etteantud juhiste järgi. DeepSeeki sisemiste testide põhjal ületab DeepSeek V3 nii allalaaditavad "avatud" mudelid kui ka "suletud" tehisintellekti mudelid, millele pääseb ligi ainult API kaudu. Kodeerimisvõistlustel Codeforcesil, mis on programmeerimisvõistluste platvorm, edestab DeepSeek teisi mudeleid, sealhulgas Meta Llama 3. 1 405B, OpenAI GPT-4o ja Alibaba Qwen 2. 5 72B. See paistab silma ka Aider Polyglot testis, mille eesmärk on hinnata, kas mudel suudab kirjutada uut koodi, mis integreerub olemasoleva koodiga. DeepSeek V3 on treenitud 14, 8 triljoni tokeni suuruse andmekogumiga. Andmeteaduses esindavad tokenid toorandmete osi, kusjuures 1 miljon tokenit vastab ligikaudu 750 000 sõnale. Mudel on ka mastaapselt suur, sisaldades 671 miljardit parameetrit (või 685 miljardit tehisintellekti arendusplatvormil Hugging Face), mis on sisemised muutujad, mida mudelid kasutavad otsuste tegemiseks. See suurus on umbes 1, 6 korda suurem kui Llama 3. 1 405B 405 miljardit parameetrit. Tavaliselt teevad suurema parameetrite arvuga mudelid paremaid tulemusi, kuid need vajavad ka võimsat riistvara sujuvaks töötamiseks. Optimeerimata DeepSeek V3 vajab mõistliku kiiruse saavutamiseks kõrgekvaliteediliste GPU-de baasi. Vaatamata oma ebapraktilisusele on DeepSeek V3 saavutus. DeepSeek treenis mudelit ligikaudu kahe kuuga, kasutades Nvidia H800 GPU-dega andmekeskust, mille ostmist USA kaubandusministeerium on hiljuti Hiina ettevõtetele keelanud.
Firma väidab, et kulutas DeepSeek V3 treenimiseks vaid 5, 5 miljonit dollarit, mis on murdosa OpenAI GPT-4 sarnaste mudelite kuludest. Kuid mudeli poliitilised seisukohad on mõneti piiratud. Näiteks ei kommenteeri see Tiananmeni väljaku teemat. Hiina ettevõttena allub DeepSeek Hiina interneti regulatsioonidele, tagades, et mudeli vastused toetavad "sotsialistlikke põhiväärtusi". Paljud Hiina tehisintellekti süsteemid väldivad teemasid, mis võivad reguleerijaid ärritada, näiteks Xi Jinpingi režiimi puudutavaid arutelusid. DeepSeek, mis hiljuti tutvustas DeepSeek-R1 konkurendina OpenAI o1 "mõtlemisvõime" mudelile, on intrigeeriv organisatsioon. Seda toetab High-Flyer Capital Management, Hiina riskifond, mis kasutab kauplemiseks tehisintellekti. High-Flyer ehitab oma serveriklastrid mudelite treenimiseks, millest üks sisaldab väidetavalt 10 000 Nvidia A100 GPU-d ning maksab 1 miljard jeeni (~138 miljonit dollarit). Ettevõtte asutaja on arvutiteaduse lõpetanud Liang Wenfeng, kelle eesmärk on DeepSeeki kaudu saavutada "superintelligentne" tehisintellekt. Wenfeng kirjeldas selle aasta alguses antud intervjuus suletud lähtekoodiga tehisintellekte, nagu OpenAI omi, kui "ajutist" eelist. “[See] ei ole takistanud teisi järele jõudmast, " täheldas ta. Tõepoolest.
DeepSeek V3: Hiina juhtiv avatud tehisintellektimudel avalikustatud
Anthropic, juhtiv tehisintellekti ettevõte, on avalikustanud murrangulise ja murettekitava arengusuuna küberturvalisuses: esimese dokumenteeritud juhtumi, kus tehisintellekt iseseisvalt juhib häkkimiskampaaniat.
„Vaata sammast, härra, liigu edasi,” ütleb ICE-tähise ja “POICE” märgistusega märkega politseinikke kandev ohvitser Mehhikost pärit näootsaga mehele, kes on riietunud Walmarti töötaja vesti.
Kevin Reilly, kogenud Hollywoodi juht, keda tuntakse tema olulise rolli tõttu tuntuimate telesarjade nagu "Sopranod", "The Office" ja "Glee" toimumisel, on võtnud vastu uue väljakutse ja astunud Kartel, Beverly Hillsis baseeruva tehisintellekti loovnõustamise ettevõtte, tegevjuhi rolli.
Euroopa Liit on algatanud suure antitrust-uurimise Google’i rämpsposti poliitika kohta pärast muresid mitmetelt uudisteväljaannete poolt kogu Euroopas.
SINGAPURA, 13.
Tehisintellekt (AI) muutub kiiresti digitaalmarkkinimises transformatiivseks jõuks, eriti otsingumootorite optimeerimises (SEO).
Shelley E. Kohan tervitab Leigh Sevinit, Endeari kaasasutajat, kes pakub kaasaegset CRM-lahendust omnikanalilisele jaemüügibrändile.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today