„Anthropic“ išleidžia „Claude Opus 4“ su pažangiais dirbtinio intelekto saugumo protokolais, siekiant išvengti piktnaudžiavimo

2025 m. gegužės 22 d. „Anthropic“, viena iš pirmaujančių dirbtinio intelekto tyrimų įmonių, pristatė Claude Opus 4 – savo pažangiausią iki šiol dirbtinio intelekto modelį. Šalia šio išleidimo įmonė įdiegė pagerintas saugumo protokolus ir griežtas vidines kontrolės priemones, reaguodama į vis didėjusias susirūpinimo dėl galimo galingo dirbtinio intelekto piktnaudžiavimo, ypač bioweapons ir kitų pavojingų veiklų kūrimo. Claude Opus 4 žymi reikšmingą pažangą palyginti su ankstesniais Claude modeliais, rodydamas žymiai geresnius rezultatus sudėtingose užduotyse. Vidaus testai atskleidė jo nuostabią gebėjimą netgi pradedantiesiems vadovauti procedūroms, kurios gali būti pavojingos ar neetiškos, įskaitant pagalbą biologinių ginklų kūrime – tai išvada, kuri suerzino tiek „Anthropic“, tiek platesnę dirbtinio intelekto bendruomenę. Reaguodama į tai, „Anthropic“ įvedė Atsakingo Didinimo Politiką (RSP) – išsamų pagrindų rinkinį etiškai diegti pažangų dirbtinį intelektą. Tai apėmė įgyvendinant Dirbtinio intelekto saugumo lygio 3 (ASL-3) protokolus, kurie yra vieni griežčiausių pramonėje saugumo ir etikos standartų. Priemonės pagal ASL-3 apima patobulintą kibernetinį saugumą, skirtą užkirsti kelią neįgaliotam išnaudojimui, sudėtingas anti-jailbreak sistemas, blokuojančias bandymus apeiti saugumo ribojimus, ir specializuotus komandų klasifikatorius, skirtus aptikti ir neutralizuoti kenksmingas arba kenkėjiškas užklausas.
Be to, „Anthropic“ sukūrė apdovanojimų programą, skatinančią išorinius tyrėjus ir įsilaužėlius identifikuoti trūkumus Claude Opus 4, atspindėdama bendradarbiavimo požiūrį į rizikų valdymą, susiduriant su iššūkiais užtikrinant saugumą naujausių dirbtinio intelekto technologijų nuo kylantčių grėsmių. Nors „Anthropic“ nesuteikė Claude Opus 4 iš karto kaip pavojingo – pripažindama sudėtingumą vertinant dirbtinio intelekto rizikas – įmonė pasirinko atsargumo poziciją įvedant griežtas kontrolės priemones. Šis modelis gali tapti svarbiu precedentų tiek kūrėjams, tiek reguliatoriams, tvarkant galimai pavojingų galių turinčių dirbtinio intelekto sistemų diegimą. Nors Atsakingo Didinimo Politika yra savanoriška, „Anthropic“ siekia, kad jos priemonės paskatintų platesnę pramonės standartų kūrimą ir skatintų bendrą atsakomybę tarp dirbtinio intelekto kūrėjų. Derindama griežtas saugumo priemones su konkurencingais produktais, „Anthropic“ siekia subalansuoti inovacijas ir etinį valdymą – sudėtingas balansavimas, ypač atsižvelgiant į tai, kad Claude Opus 4 prognozuojamos metinės pajamos viršija du milijardus dolerių ir ji konkurencinėje kovoje su pagrindinėmis dirbtinio intelekto platformomis, pavyzdžiui, „OpenAI“ ChatGPT. Šios saugumo problemos ir politikos atsiranda globalinių diskusijų apie dirbtinio intelekto reguliavimą kontekste. Daugelis ekspertų prognozuoja, kad vyriausybės ir tarptautinės institucijos ima griežtinti taisykles, reglamentuojančias pažangaus DI plėtrą ir naudojimą. Kol tokios reguliacijos dar nėra plačiai įteisintos ir įgyvendintos, vidinės politikos, tokios kaip „Anthropic“ politikos, lieka vienomis iš efektyviausių priemonių valdant DI keliamas rizikas. Apibendrinant, Claude Opus 4 paleidimas žymi reikšmingą pažangą DI galimybių srityje, kartu su didėjančiu sąmoningumu apie etikos ir saugumo iššūkius. „Anthropic“ aktyvus įsipareigojimas stiprioms saugumo priemonėms pavyzdingai parodo požiūrį, kuris gali formuoti būsimus pramonės standartus ir reguliavimo schemas. Kadangi DI modeliai tampa vis galingesni ir universalesni, apsauga nuo piktnaudžiavimo tampa dar svarbesnė, todėl skubiai reikalingas koordinuotas pastangas technologijų ekosistemoje, siekiant užtikrinti atsakingą šių transformacinių įrankių plėtrą ir diegimą.
Brief news summary
2025 m. gegužės 22 d. Anthropic pristatė Claude Opus 4 – savo pažangiausią iki šiol dirbtinio intelekto modelį, žymintį didelį proveržį dirbtinio intelekto srityje. Sukurtas sudėtingiems užduoties sprendimams su aukštu efektyvumu, Claude Opus 4 taip pat kelia reikšmingų saugumo iššūkių, ypač potencialiai pavojingų neteisėtam naudojimui jautriose srityse, tokiose kaip biologinių ginklų kūrimas. Norint sumažinti šias rizikas, Anthropic įgyvendino griežtas saugumo priemones pagal atsakingo masto didinimo politiką, įskaitant AI saugumo lygį 3 protokolus – stiprinančią kibernetinį saugumą, anti-jailbreak apsaugą ir greitus klasifikatorius, nustatančius kenksmingą turinį. Įmonė taip pat pradėjo nuolaidų programą, siekdama įtraukti išorės ekspertus nustatyti pažeidžiamumus. Nors Claude Opus 4 nėra iš esmės pavojingas, Anthropic pabrėžia atsargaus priežiūros ir etiško naudojimo svarbą. Šis modelis, turintis tikslą konkuruoti su tokiais konkurentais kaip OpenAI ChatGPT ir tikėtina, kad generuos daugiau nei 2 milijardus dolerių kasmet, atskleidžia esminį balansą tarp pažangios dirbtinio intelekto inovacijos ir atsakingo taikymo. Šis pasiekimas reikalauja pasaulinio bendradarbiavimo ir reguliavimo, siekiant užtikrinti saugią ir etišką AI technologijų pažangą.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Ataskaita: Apple iki 2026 metų pabaigos pristatys…
Antradienį (gegužės 22 d.) Bloomberg pranešė, kad Apple planuoja pradėti gaminti daug prototipų iki šių metų pabaigos ir siekia pristatyti išmaniuosius akinius iki 2026 metų pabaigos, remiantis anoniminiais šaltiniais.

JAV Kongresmanas Tomas Emmeris pristato blokų gra…
Billas paaiškina, kad kūrėjai, kurie nesaugo lėšų, nėra pinigų pernešėjai Pramonės grupės palaiko Blockchain Regulatory Certainty Act (BRCA), kad padėtų JAV išlaikyti lyderystę blokų grandinės inovacijose

„OpenAI“ įsigijimas Jony Ive'o startuolio signali…
OpenAI padarė didelį žingsnį į priekį, siekdama pažengti dirbtinio intelekto srityje, įsigydama likusias Jony Ive kūrimo startuolio io akcijas už 5 milijardus dolerių vertės akcijų sandorį.

R3 ir Solana bendradarbiauja leidžiant tokenizuot…
R3 ir Solana fondas susivienijo įgyvendinti reguliuojamus realaus pasaulio aktyvus viešojoje blokų grandinėje.

Kaip dirbtinio intelekto sugeneruotas vasaros ska…
Keletas nacionalinių laikraščių, įskaitant Čikagos Sun-Times ir bent vieną „The Philadelphia Inquirer“ leidimą, paskelbė išplėstinį vasaros knygų sąrašą, kuriame buvo tik visiškai fiktyvios knygos, priskirtos žinomiems autoriaus.

Kraken siūlys tokenizuotas JAV akcijas Solanos bl…
Kraken kriptovaliutų mainai planuoja pasiūlyti žinomų JAV akcijų tokenizuotas versijas per naują produktą pavadinimu xStocks, kuris yra paleistas bendradarbiaujant su Backed Finance.

OpenAI sudaro susitarimą su „iPhone“ dizaineriu J…
OpenAI, pirmaujantis dirbtinio intelekto pokalbių roboto ChatGPT kūrėjas, rengiasi įžengti į fizinės įrangos sritį.