Anthropic hefir látið frá sér Claude Opus 4 með þróuðum öryggisreglum um gervigreind til að koma í veg fyrir misnotkun

Á 22. maí 2025 kynnti Anthropic, leiðandi rannsóknarfyrirtæki á sviði gáðvísindarannsókna, Claude Opus 4, sitt allra þróuðasta ML-model, til þessa tíma. Samhliða þessu kynningi sutti fyrirtækið auknum öryggisreglum og strangari innri stjórntækjum, sem byggðust á vaxandi áhyggjum af mögulegri misnotkun á öflugri gervigreind— sérstaklega til að búa til lífvaðarbjargvop og aðrar skaðlegar athafnir. Claude Opus 4 merkir mikilvægan stíg fram frá fyrri Claude-gerðum, og sýnir merkilega betri árangur við flókin verkefni. Innri prófanir sýndu á ótrúlegan hátt að hún gat leitt jafnvel nýliða í að framkvæma aðferðir sem gætu verið hættulegar eða ólögmætar, þar á meðal aðstoð við að búa til lífvirk orrustuvopn—uppgötvun sem vakti áhyggjur hjá bæði Anthropic og stærri gervigreindasamfélaginu. Í kjölfarið innleiddi Anthropic ábyrgt skali samkvæmt stefnu sinni (RSP), víðtæka umgjörð fyrir siðferðilega notkun háþróaðrar gervigreindar. Þetta fól í sér innleiðingu á gæðakerfi á stigi 3 (ASL-3), sem eru meðal ítarlegaste öryggis- og siðferðisstaðla greinarinnar. Aðgerðir samkvæmt ASL-3 fela í sér bætt netöryggi til að koma í veg fyrir ólögmæta nýtingu, flókin kerfi til að koma í veg fyrir reynslu af að slaka á öryggisreglum, og sérhæfð flokkunarkerfi fyrir beiðnir sem er ætlað að greina og gera viðleitni að eyðileggja skaðlegar eða illugar spurningar. Enn fremur stofnaði Anthropic bónuskerfi, sem hvatar utanaðkomandi rannsóknarmenn og tölvunarhakar til að greina veikleika í Claude Opus 4, sem endurspeglar samstarfsvetvang til að stýra áhættu við þær áskoranir sem fylgja því að verja nýstárlegar gervigreindarvélmenni frá nýjum ógnunum. Þó að Anthropic hafi verið varkár með að álykta að Claude Opus 4 sé í sjálfu sér hættuleg—og viðurkenndi að erfiðleikar fylgi mati á áhættu er varðar gervigreind—sótti fyrirtækið í varúðarstefnu með strangri stjórn.
Þessi módel gæti skapað mikilvægt fordæmi fyrir bæði þróunaraðila og eftirlitsaðila um notkun öflugar gervigreindar, sem gæti valdið skaða ef hún er misnotuð. Þótt ábyrgt skali stefna sé valkvæð, stefnir Anthropic að því að aðgerðir þess hvetji til víðtækari heilbrigðra staðla í iðnaðinum og stuðli að sameiginlegri ábyrgð meðal skapenda gervigreindar. Með því að sameina stranga öryggisráðstafanir við keppnishæf vöru, leitast Anthropic við að finna jafnvægi milli nýsköpunar og siðferðilegrar umhyggju—sem er erfið jafnvægi með tilliti til áætlaðs árlegs tekjumets sem nemur yfir tveimur milljörðum dollara og sterkra keppinauta á vettvangi gervigreindar, svo sem ChatGPT frá OpenAI. Þessar öryggisáhyggjur og stefnur koma fram í skýrari viðleitni til að ræða reglugerðir um gervigreind. Margir sérfræðingar sjá fyrir sér að stjórnvöld og alþjóðlegar stofnanir stefni leiðina að strängari reglum um þróun og notkun háþróaðrar gervigreindar. Á meðan ekki eru í gildi almennar reglugerðir og framkvæmd liggur á að vera nýta faglegar stefnumörkun, eru innri stefnur eins og sú hjá Anthropic meðal af örfáum áhrifaríkustu tólunum til að stjórna áhættu gervigreindar. Í stuttu máli, markaðssetning Claude Opus 4 markar tímamót í getu gervigreindar ásamt aukinni meðvitund um siðferðisleg og öryggislegt verkefni. Forvörnum vegna öflugra öryggisráðstafana hjá Anthropic sýna fram á nálgun sem mun líklega móta viðmið og reglugerðir í framtíðinni. Með því að fá gervigreindarmódel sem verða sífellt kraftmeiri og fjölbreyttari, verður vöndun gegn misnotkun bæði mikilvægari og nauðsynlegri, og ríkur ávinningur felst í því að samræma markmið um ábyrgð í þróun og notkun þessara umbreytandi tækja.
Brief news summary
Þann 22. maí 2025 kynnti Anthropic Claude Opus 4, sitt þróaðasta gervigreinda líkan til þessa, sem er stórt skref fram á við í gervigreind. Hannað til að takast á við flókin verkefni með mikilli hæfni, kynnir Claude Opus 4 einnig mikilvægar öryggisskraflur, sérstaklega varðandi mögulegt misnotkun á viðkvæmum sviðum eins og þróun sýkla vopna. Til að bregðast við þessum hættum setti Anthropic á laggirnar strangar öryggisráðstafanir samkvæmt Ábyrga stækkunastefnu sinni, þar á meðal öryggistakmörk AI Level 3 eins og bættöryggiskerfi, varnir gegn jailbreak og skjótir flokkarar til að greina skaðlegt efni. Fyrirtækið hóf einnig bónusáætlun til að laða að ytri sérfræðinga til að greina veikleika. Þó að Claude Opus 4 sé ekki í sjálfu sér hættulegt leggur Anthropic ríka áherslu á mikilvægi varfærni og siðferðilegrar notkunar. Stöðugt er ætlað að keppa við keppinauta eins og ChatGPT hjá OpenAI og búist við að framleiða meira en 2 milljarða dollara á ári, og sýnir Claude Opus 4 mikilvægi þess að finna jafnvægi milli nýsköpunar í gervigreind og ábyrgðarfullrar notkunar. Þessi þróun kallar á alþjóðlegt samstarf og tilskipun um til að tryggja öryggi og siðferðilega framvindu í gervigreindartækni.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

OpenAI semur viðskiptasamning við hönnuð iPhone, …
OpenAI, skapari leiðandi gervigreindarspjallsins ChatGPT, er að undirbúa innrás í þann hluta tækjabúnaðar.

FIFA kallar á Avalanche til að hefja sérhæft bloc…
Alþjóðlega knattspyrnusambandið (FIFA) tilkynnti 22.

dómari íhugar refsinga vegna gervigreindarframlei…
Félagsdómari í Birmingham, Alabama, metur hvort hann eigi að refsaa af vinsæla lögfræðistofunni Butler Snow eftir að hafa uppgötvað fimm false lagalegar tilvitnanir í nýlegum dómshöfðunum tengdum ötölum málsókn um öryggi fangans við William E. Donaldson Réttarhús, þar sem fanginn var stunginn í marga sinn.

Blockchain samtökin seldu CFTC
Verkefnið um Hringtorg, samstarfsaðili Prospect, skoðar gagnrýnið framkvæmdavald og forsetvaldið; fylgstu með verkum þeirra á therevolvingdoorproject.org.

Þingmannahópar mótmæla yfir borðhaldi Trumps fors…
Á Bitcoin Pizzudaginn náði Bitcoin sögulegu nýju meti, yfir 110.000 dollara, sem tákn um marktæka vöxt og víðtæka traust fjárfesta á kriptovanum sem alternativ eignarform.

OpenAI sameinar krafta sína við Jony Ive í 6,5 mi…
Á síðustu árum hefur tilkoma gervigreindar breytt tækniumhverfinu verulega, ótrúlega nýstárlega í forritun hugbúnaðar, upplýsingaleit og mynd- og vídeógerð — allt framkvæmt með einföldum beiðnum til spjallmennis.

R3 boðar strategíska breytingu á leiðsögn samanbo…
R3 og Solana-stofnunin hafa tilkynnt um strategískt samstarf sem samþættir forystubanka fyrirtækjagreiðslurök R3, Corda, við háafkastagreinarmarkað Solana.