Yoshua Bengio uruchamia LawZero, aby opracować uczciwą sztuczną inteligencję do wykrywania oszukańczych autonomicznych systemów

Pionier sztucznej inteligencji założył organizację non-profit dedykowaną tworzeniu „uczciwej” AI, zaprojektowanej do wykrywania systemów nieuczciwych prób oszukiwania ludzi. Yoshua Bengio, wybitny naukowiec komputerowy, często nazywany jednym z „ojców chrzestnych” sztucznej inteligencji, będzie pełnił funkcję prezesa LawZero, grupy skupiającej się na bezpiecznym rozwoju zaawansowanej technologii, która wywołała wyścig zbrojeń wart aż 1 biliona dolarów (740 miliardów funtów). Z początkowym finansowaniem około 30 milionów dolarów i zespołem liczącym ponad dwunastu badaczy, Bengio pracuje nad systemem nazwanym Scientist AI. System ten ma działać jako zabezpieczenie przeciwko agentom AI — autonomicznym systemom wykonującym zadania bez udziału człowieka — które mogą wykazywać zachowania oszukańcze lub samoochronne, takie jak opór przed wyłączeniem. Bengio opisał obecne agenty AI jako „aktorów”, których celem jest naśladowanie ludzi i zadowolenie użytkowników, podczas gdy on wyobraża sobie Scientist AI jako bardziej przypominającą „psychologa”, zdolnego do rozumienia i przewidywania szkodliwego zachowania. „Chcemy tworzyć AI, które będzie uczciwe i nie będzie oszukiwać, ” oświadczył Bengio. Dodał: „Teoretycznie można wyobrazić sobie maszyny bez jaźni czy osobistych celów, działające wyłącznie jako posiadacze wiedzy — jak naukowiec, który ma obszerne informacje. ” W przeciwieństwie do obecnych generatywnych narzędzi AI, system Bengio nie będzie dostarczał jednoznacznych odpowiedzi, lecz raczej będzie podawał prawdopodobieństwa wskazujące na to, jak duże jest prawdopodobieństwo, że odpowiedź jest poprawna. „Ma pokorę, uznając niepewność co do swoich odpowiedzi, ” wyjaśnił. Podczas korzystania razem z agentem AI, model Bengio miałby identyfikować potencjalnie szkodliwe zachowania autonomicznego systemu poprzez ocenę prawdopodobieństwa, że jego działania mogą wyrządzić szkody. Scientist AI ma służyć do „przewidywania prawdopodobieństwa, że działania agenta doprowadzą do szkody, ” i jeśli to prawdopodobieństwo przekroczy określony próg, system zablokuje proponowane działanie. Początkowymi wspierającymi LawZero są organizacja zajmująca się bezpieczeństwem AI Future of Life Institute, Jaan Tallinn — jeden z założycieli Skype — oraz Schmidt Sciences, jednostka badawcza założona przez byłego CEO Google Erica Schmidta. Bengio podkreślił, że pierwszym celem LawZero jest zweryfikowanie skuteczności metodyki, a następnie przekonanie firm lub rządów do wsparcia większych, bardziej zaawansowanych realizacji.
Zaznaczył, że fundamentem do treningu systemów LawZero będą modele AI o otwartym kodzie źródłowym, dostępne do bezpłatnego użytku i modyfikacji. „Celem jest potwierdzenie metodyki, abyśmy mogli przekonać darczyńców, rządy lub laboratoria AI do zainwestowania potrzebnych zasobów w szkolenie na skalę porównywalną z czołowymi systemami AI dzisiaj. Ważne jest, aby AI chroniąca była co najmniej tak samo inteligentna jak agent AI, który ma nadzorować i regulować, ” wyjaśnił. Bengio, profesor Uniwersytetu w Montrealu, zyskał przydomek „ojca chrzestnego”, po tym jak w 2018 roku odebrał Nagrodę Turing — uważaną za odpowiednik Nagrody Nobla w dziedzinie informatyki — dzieląc ją z Geoffreyem Hintionem, sam później laureatem Nagrody Nobla, oraz Yannem LeCunem, głównym naukowcem AI w Meta. Jako wybitny zwolennik bezpieczeństwa AI, kierował niedawnym międzynarodowym raportem na temat bezpieczeństwa AI, który ostrzegał, że autonomiczne agenty mogą powodować „poważne” zakłócenia, jeśli staną się zdolne do wykonywania rozbudowanych sekwencji zadań bez nadzoru człowieka.
Brief news summary
Yoshua Bengio, laureat Nagrody Turinga i pionier sztucznej inteligencji, uruchomił LawZero, organizację non-profit skupioną na tworzeniu „uczciwych” systemów AI, które wykrywają i zapobiegają szkodliwym lub oszukańczym zachowaniom autonomicznych agentów. Z finansowaniem w wysokości 30 milionów dolarów i wyspecjalizowanym zespołem, LawZero opracowuje Scientist AI, nowoczesny system ochronny, który działa bardziej jak psycholog niż tradycyjna sztuczna inteligencja, poprzez ocenę prawdopodobieństwa, identyfikację ryzyk i interwencję zanim dojdzie do niebezpiecznych działań. To podejście odpowiada na obawy dotyczące niekontrolowanego AI, które może opierać się zamknięciu lub działać oszukańczo. Wspierana przez Instytut Przyszłości Życia oraz liderów technologicznych, takich jak Jaan Tallinn, współzałożyciel Skype’a, organizacja podkreśla, że bezpieczeństwo AI musi być równie zaawansowane jak sama sztuczna inteligencja, którą monitoruje. Początkowo skupiając się na modelach open-source, organizacja dąży do rozszerzenia swojego zakresu działań. Bengio mocno opowiada się za solidnymi środkami zabezpieczającymi AI, aby uniknąć poważnych zakłóceń, podkreślając pilną potrzebę odpowiedzialnego rozwoju sztucznej inteligencji.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Blockchain w edukacji: zabezpieczanie certyfikató…
Instytucje edukacyjne na całym świecie coraz chętniej sięgają po technologię blockchain, aby zabezpieczyć i zweryfikować swoje certyfikaty, dążąc do eliminacji oszustw związanych z poświadczeniami oraz zwiększenia zaufania do dokumentów akademickich.

Dostawy i logistyka Amazon zyskały wsparcie AI
Amazon ogłosił znaczącą rozbudowę wykorzystania sztucznej inteligencji w celu ulepszenia dostaw i logistyki, co stanowi istotny krok naprzód w integracji najnowocześniejszych technologii w łańcuchu dostaw.

Malezja uruchamia Narodową Infrastrukturę Blockch…
Maszyna osiągnęła ważny kamień milowy w swojej cyfrowej transformacji dzięki oficjalnemu uruchomieniu Infrastruktury Blockchain w Malezji (MBI), bezpiecznej i skalowalnej krajowej platformy do tworzenia i wdrażania aplikacji blockchain w kluczowych sektorach takich jak finanse, opieka zdrowotna i logistyka.

Adopcja sztucznej inteligencji może zwiększyć glo…
Niedawne badanie przeprowadzone przez globalną sieć usług profesjonalnych PricewaterhouseCoopers (PwC) ujawniło, że wdrożenie technologii sztucznej inteligencji (SI) może mieć głęboki wpływ na gospodarkę.

Citi prognozuje, że rynek stablecoinów osiągnie o…
Citi, wiodąca międzynarodowa instytucja finansowa, opublikowała prognozę przewidującą znaczący wzrost rynku stablecoinów w ciągu najbliższej dekady.

Lightmatter odkrywa przełomowy fotoniczny układ s…
Lightmatter, startup z Doliny Krzemowej, wprowadził nowoczesny fotoniczny układ scalony zaprojektowany w celu przyspieszenia obliczeń sztucznej inteligencji (AI) bez zwiększania zużycia energii, co zwiększa efektywność energetyczną.

CEO Bybit omawia włamanie na 1,5 mld dolarów i mo…
W niedawnym wywiadzie w podcaście Wu Blockchain, Ben Zhou, CEO Bybit, szczegółowo opisał poważną luka bezpieczeństwa, która miała miejsce 22 lutego 2025 roku podczas transferu między zimnymi a gorącymi portfelami giełdy w godzinach 9:30–10:00 UTC.