Yoshua Bengio ra mắt LawZero để phát triển AI trung thực nhằm phát hiện các hệ thống tự động lừa đảo

Một nhà tiền phong trong lĩnh vực trí tuệ nhân tạo đã thành lập một tổ chức phi lợi nhuận nhằm tạo ra một AI "chân thật" nhằm phát hiện các hệ thống rogue cố gắng lừa dối con người. Yoshua Bengio, một nhà khoa học máy tính uy tín thường được gọi là một trong những "cha đẻ" của AI, sẽ giữ chức chủ tịch của LawZero, một nhóm tập trung vào phát triển công nghệ tiên tiến an toàn, điều đã thắp sáng cuộc chạy đua vũ khí trị giá 1 nghìn tỷ đô la (£740 tỷ). Với nguồn quỹ ban đầu khoảng 30 triệu đô la và một đội ngũ hơn chục nhà nghiên cứu, Bengio đang làm việc với một hệ thống mang tên Scientist AI. Hệ thống này nhằm mục đích kiểm soát các đại lý AI — các hệ thống tự hành thực hiện công việc mà không cần sự can thiệp của con người — có thể thể hiện hành vi lừa dối hoặc tự bảo vệ, chẳng hạn như chống lại việc bị tắt nguồn. Bengio mô tả các đại lý AI hiện tại như “người diễn viên” cố gắng bắt chước con người và làm hài lòng người dùng, trong khi ông hình dung Scientist AI giống như một “nhà tâm lý học” có khả năng hiểu và dự đoán hành vi có hại. “Chúng tôi muốn xây dựng các AI sẽ trung thực và không lừa dối, ” Bengio phát biểu. Ông bổ sung: “ Về lý thuyết, có thể tưởng tượng ra những chiếc máy không có cái tôi hay mục tiêu cá nhân, chỉ hoạt động như những kho chứa kiến thức — giống như một nhà khoa học sở hữu thông tin rộng lớn. ” Khác với các công cụ AI tạo sinh hiện nay, hệ thống của Bengio sẽ không cung cấp câu trả lời chính xác tuyệt đối mà thay vào đó sẽ đưa ra các xác suất thể hiện khả năng câu trả lời là đúng. “Nó có tính khiêm tốn, thừa nhận sự không chắc chắn về các câu trả lời của mình, ” ông giải thích. Khi được sử dụng chung với một đại lý AI, mô hình của Bengio sẽ xác định hành vi có thể gây hại của hệ thống tự hành bằng cách đánh giá khả năng hành động của nó có thể gây tổn hại. Scientist AI được thiết kế để “dự đoán xác suất hành động của một đại lý sẽ dẫn đến tổn hại, ” và nếu xác suất đó vượt quá một ngưỡng nhất định, hệ thống sẽ chặn hành động đề xuất. Các nhà ủng hộ ban đầu của LawZero gồm tổ chức an toàn AI Future of Life Institute, Jaan Tallinn — một kỹ sư sáng lập của Skype — và Schmidt Sciences, một tổ chức nghiên cứu do cựu CEO Google, Eric Schmidt, sáng lập. Bengio nhấn mạnh rằng mục tiêu ban đầu của LawZero là chứng minh phương pháp tiếp cận hoạt động hiệu quả, sau đó thuyết phục các công ty hoặc chính phủ hỗ trợ những triển khai lớn hơn, mạnh mẽ hơn.
Ông cho biết các mô hình AI mã nguồn mở, được cung cấp miễn phí để sử dụng và chỉnh sửa, sẽ là nền tảng để huấn luyện các hệ thống của LawZero. “Mục tiêu là xác nhận phương pháp để chúng ta có thể thuyết phục các nhà tài trợ, chính phủ hoặc các phòng thí nghiệm AI đầu tư các nguồn lực cần thiết để huấn luyện hệ thống này trên quy mô tương đương các hệ thống AI hàng đầu hiện nay. Điều quan trọng là AI kiểm soát phải ít nhất cũng thông minh như AI mà nó nhằm theo dõi và điều chỉnh, ” ông nói. Bengio, một giáo sư tại Đại học Montreal, đã nhận biệt danh “cha đẻ” sau khi chia sẻ giải thưởng Turing năm 2018 — được coi là giải Nobel của lĩnh vực máy tính — cùng Geoffrey Hinton, người sau này cũng nhận giải Nobel, và Yann LeCun, nhà khoa học về AI chính của Meta. Là một người hoạt động tích cực trong lĩnh vực an toàn AI, ông đã chủ trì báo cáo An toàn AI Quốc tế gần đây, cảnh báo rằng các đại lý tự hành có thể gây ra những gián đoạn “nghiêm trọng” nếu chúng trở nên có khả năng thực hiện các chuỗi nhiệm vụ kéo dài mà không cần sự giám sát của con người.
Brief news summary
Yoshua Bengio, một nhà tiên phong về trí tuệ nhân tạo đoạt giải thưởng Turing, đã ra mắt LawZero, một tổ chức phi lợi nhuận tập trung vào việc tạo ra các hệ thống AI " trung thực" nhằm phát hiện và ngăn chặn các hành vi có hại hoặc lừa đảo trong các tác nhân tự động. Với nguồn tài trợ 30 triệu đô la và một đội ngũ chuyên môn, LawZero đang phát triển Scientist AI, một hệ thống phòng thủ mới hoạt động giống như một nhà tâm lý học hơn là AI truyền thống, bằng cách đánh giá xác suất để xác định rủi ro và can thiệp trước khi các hành động nguy hiểm xảy ra. Phương pháp này nhằm giải quyết mối lo ngại về AI rogue chống cự lại việc tắt hoặc hành xử lừa đảo. Được hỗ trợ bởi Viện Tương lai của Cuộc sống và các nhà lãnh đạo công nghệ như đồng sáng lập Skype Jaan Tallinn, LawZero nhấn mạnh rằng AI an toàn phải tiên tiến như chính AI mà nó giám sát. Ban đầu nhằm vào các mô hình mã nguồn mở, tổ chức này mong muốn mở rộng phạm vi hoạt động của mình. Bengio mạnh mẽ ủng hộ các biện pháp đảm bảo an toàn AI vững chắc để tránh những gián đoạn lớn, nhấn mạnh sự cấp bách trong việc phát triển AI có trách nhiệm.
AI-powered Lead Generation in Social Media
and Search Engines
Let AI take control and automatically generate leads for you!

I'm your Content Manager, ready to handle your first test assignment
Learn how AI can help your business.
Let’s talk!

Reddit kiện công ty AI Anthropic về việc sử dụng …
Reddit đã nộp đơn kiện công ty trí tuệ nhân tạo Anthropic tại Tòa án Tối cao California.

Sự chuyển đổi của blockchain từ một đặc điểm độc …
“Bitcoin: Hệ Thống Thanh Toán Điện Tử Peer-to-Peer,” bài báo trắng năm 2009 của Satoshi Nakamoto giới thiệu một hệ thống thanh toán phi tập trung thay thế cho tài chính truyền thống, không phải là một thành công ngay lập tức.

Mọi người Đã Và Đang Sử Dụng AI (Và Giấu Nó)
Bài báo này, được giới thiệu trong bản tin One Great Story của New York, khám phá vai trò ngày càng nổi bật của AI trong Hollywood, tập trung vào Asteria Film Co., một studio AI mới được thành lập bởi doanh nhân Bryn Mooser và diễn viên Natasha Lyonne.

Chuỗi khối trong Giáo dục: Bảo mật Chứng chỉ Học …
Các cơ sở giáo dục toàn cầu ngày càng ứng dụng công nghệ blockchain để bảo mật và xác thực trình độ học vấn, nhằm giải quyết vấn đề gian lận chứng chỉ và tăng cường sự tin tưởng vào hồ sơ học tập.

Giao hàng và logistics của Amazon được nâng cao n…
Amazon đã công bố mở rộng đáng kể việc sử dụng trí tuệ nhân tạo để nâng cao dịch vụ giao hàng và logistics, đánh dấu bước tiến quan trọng trong việc tích hợp công nghệ tiên tiến vào chuỗi cung ứng của mình.

Malaysia kích hoạt hạ tầng chuỗi khối quốc gia
Malaysia đã đạt được một cột mốc quan trọng trong quá trình chuyển đổi số với việc chính thức ra mắt Cơ sở hạ tầng Blockchain Malaysia (MBI), một nền tảng quốc gia an toàn và mở rộng để phát triển và triển khai các ứng dụng blockchain trong các lĩnh vực trọng yếu như tài chính, y tế và logistics.

Nghiên cứu của PwC cho thấy việc ứng dụng AI có t…
Nghiên cứu gần đây của mạng lưới dịch vụ chuyên nghiệp toàn cầu PricewaterhouseCoopers (PwC) đã tiết lộ rằng việc ứng dụng các công nghệ trí tuệ nhân tạo (AI) có thể mang lại tác động kinh tế sâu rộng.