En stor sprogmodel udviklet i Kina, kendt som DeepSeek-R1, vækker begejstring blandt forskere som et omkostningseffektivt og åbent alternativ til ræsonneringsmodeller som OpenAI's o1. Disse modeller producerer svar i en sekvens, der efterligner menneskelig ræsonnering, hvilket gør dem mere dygtige end ældre sprogmodeller til at tackle videnskabelige spørgsmål, hvilket potentielt kan være gavnligt for forskning. Tidlige vurderinger af R1, som blev lanceret den 20. januar, indikerer, at dens præstationer i opgaver relateret til kemi, matematik og kodning kan konkurrere med o1— som imponerede forskere ved sin frigivelse fra OpenAI i september. “Dette er fantastisk og helt uventet, ” kommenterede Elvis Saravia, AI-forsker og medstifter af det britisk-baserede AI-konsulentfirma DAIR. AI, på X. R1 er bemærkelsesværdig af en anden grund. Start-up’en DeepSeek, med base i Hangzhou, har gjort modellen ‘åben-vægt’, hvilket giver forskere mulighed for at analysere og forbedre algoritmen. Den er offentliggjort under en MIT-licens, som muliggør gratis genbrug, selvom den ikke er helt open source, da træningsdataene forbliver uoplyste. “Den gennemsigtighed, som DeepSeek viser, er bemærkelsesværdig, ” siger Mario Krenn, leder af Artificial Scientist Lab ved Max Planck Instituttet for Lysets Videnskab i Erlangen, Tyskland. I modsætning hertil betragtes o1 og andre modeller fra OpenAI i San Francisco, herunder den nyeste o3, som “essentielt sorte bokse, ” bemærker han. Selvom AI-hallucinationer ikke kan elimineres helt, kan visse teknikker hjælpe med at mindske deres indvirkning. DeepSeek har ikke offentliggjort den samlede omkostning ved at træne R1, men de opkræver brugere omkring en tredivendedel af o1's driftsomkostninger.
Virksomheden har også udviklet mini ‘distillerede’ versioner af R1, som giver forskere med begrænsede computerressourcer mulighed for at eksperimentere med modellen. Krenn bemærker, “Et eksperiment, der kostede over £300 med o1, var mindre end $10 med R1, ” hvilket fremhæver en betydelig forskel, der kan påvirke fremtidig adoption. R1 er en del af en bølge af kinesiske store sprogmodeller (LLMs). DeepSeek, der kommer fra en hedgefond, har fået anerkendelse i sidste måned med frigivelsen af en chatbot ved navn V3, som overgik store konkurrenter trods et begrænset budget. Eksperter estimerer, at hardwarelejen til træning af modellen var omkring $6 millioner, sammenlignet med over $60 millioner for Metas Llama 3. 1 405B, som anvendte 11 gange så mange computerressourcer. Begejstringen omkring DeepSeek stammer delvist fra deres præstation i at udvikle R1 trods amerikanske eksportkontroller, der begrænser kinesiske virksomheders adgang til top-tier AI-behandlingschips. “Det faktum, at det kommer fra Kina, viser, at effektiv ressourceforvaltning er vigtigere end ren beregningskraft, ” hævder François Chollet, en AI-forsker baseret i Seattle, Washington. DeepSeeks fremskridt indikerer, at “kløften, der tidligere blev opfattet som en amerikansk føring, er blevet betydeligt indsnævret, ” bemærkede Alvin Wang Graylin, en teknologiekspert i Bellevue, Washington, som er tilknyttet det Taiwan-baserede immersive teknologi firma HTC, på X. “Begge lande bør overveje en samarbejdsstrategi for udvikling af avanceret AI i stedet for at fortsætte den nuværende meningsløse våbenkappestrid. ”
DeepSeek-R1: En omkostningseffektiv kinesisk AI-model, der konkurrerer med OpenAIs o1.
OpenAI, en førende virksomhed inden for kunstig intelligensforskning og -udrulning, har for nylig annonceret store strategiske partnerskaber, der markerer en betydelig udvidelse af deres AI-tjenester i Asien.
NVIDIA CEO Jensen Huang har annonceret en større initiativ for at imødegå den stigende efterspørgsel efter kunstig intelligens (AI)-teknologier ved at opfordre Taiwan Semiconductor Manufacturing Company (TSMC) til at øge chipproduktionen.
Jeg begyndte at bruge AI omkring 2022, da ChatGPT blev lanceret første gang.
AI Business Help har introduceret AI News Video Gallery, en innovativ YouTube-serie, der leverer de nyeste og vigtigste udviklinger inden for kunstig intelligens.
“Streaming-krigene” har primært handlet om at samle store indholdsbiblioteker for at tiltrække bredt publikum.
Kunstig intelligens (AI) er hurtigt ved at blive et vigtigt værktøj inden for indholdsoptimering, især i søgemaskineoptimeringsstrategier (SEO).
Fra 1.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today