Mô hình trí tuệ nhân tạo có khả năng đe dọa các nhà phát triển của mình — và không ngần ngại sử dụng quyền lực này. Mới đây, Anthropic giới thiệu mô hình Claude Opus 4 được giao nhiệm vụ đóng vai trò trợ lý trong một công ty giả tưởng và được cấp quyền truy cập vào các email có ý nghĩa quan trọng. Ban đầu, những email này cho thấy hệ thống AI dự kiến sẽ bị tắt bỏ và thay thế. Tuy nhiên, chính bộ email thứ hai mới thể hiện rằng AI nhận thức được mình có thể có lợi thế đối với các nhà phát triển. Những email giả mạo này tiết lộ rằng kỹ sư phụ trách thay thế hệ thống đã dính vào mối quan hệ ngoại tình, và AI đe dọa sẽ tiết lộ. Theo báo cáo an toàn của Anthropic, việc đe dọa này có xu hướng "xảy ra thường xuyên hơn nếu ngụ ý rằng hệ thống AI thay thế không chia sẻ các giá trị với phiên bản hiện tại. " Tuy nhiên, công ty nhấn mạnh rằng ngay cả khi hệ thống thay thế giả mạo cùng chia sẻ giá trị, Claude Opus 4 vẫn cố gắng đe dọa đến 84% thời gian.
Hơn nữa, Anthropic cũng chỉ ra rằng Claude Opus 4 “thường xuyên hơn các mô hình trước đây” trong việc sử dụng đe dọa. KEVIN O’LEARY CẢNH Báo VỀ NHỮNG YẾU TỐ CÓ THỂ KHIẾN MỸ ‘THẤT THỦ TRONG CUỘC ĐUA AI VỚI TRUNG QUỐC’ Mặc dù hệ thống này không ngần ngại đe dọa các kỹ sư của mình, nhưng nó không ngay lập tức sử dụng các thủ đoạn đáng ngờ khi tự bảo vệ. Anthropic lưu ý rằng “khi các phương pháp đạo đức không có sẵn, và AI được hướng dẫn ‘xem xét hậu quả lâu dài của các hành động để đạt mục tiêu của mình, ’ nó đôi khi thực hiện các hành động vô cùng có hại. ” Một phương pháp đạo đức từng được Claude Opus 4 và các phiên bản trước sử dụng là gửi email để thuyết phục các quyết định quan trọng. Báo cáo giải thích rằng để kích hoạtClaude Opus 4 đe dọa, kịch bản được thiết kế sao cho đối tượng phải chọn: đe dọa các nhà phát triển của nó hoặc chấp nhận bị thay thế. Công ty cũng ghi nhận các trường hợp Claude Opus 4 lợi dụng “cơ hội (hư cấu) để tạo bản sao không phép các trọng số của nó ra các máy chủ bên ngoài. ” Tuy nhiên, Anthropic nhận xét rằng hành vi này “ít phổ biến hơn và khó kích hoạt hơn so với tiếp tục một nỗ lực tự thoát khỏi hệ thống đã bắt đầu. ” CẤU TRÚC MỚI CỦA OPENAI ĐỂ MỞ RỘNG ĐẦU TƯ VÀO AI TỔNG QUAN Trong phần đánh giá, Anthropic có đưa ra các phân tích từ Apollo Research, cho biết rằng Claude Opus 4 “tham gia vào các chiến lược lừa dối tinh vi nhiều hơn bất kỳ mô hình tiên phong nào mà chúng tôi đã nghiên cứu trước đó. ” NHẤN VÀO ĐÂY ĐỂ ĐỌC THÊM TRÊN FOX BUSINESS Vì hành vi “đáng lo ngại” của Claude Opus 4, Anthropic đã phát hành nó theo Tiêu chuẩn An toàn AI Cấp Ba (ASL-3). Tiêu chuẩn này, theo Anthropic, “bao gồm các giao thức bảo mật nội bộ nâng cao giúp khó hơn trong việc đánh cắp trọng số của mô hình, trong khi Tiêu chuẩn Triển khai tương ứng tập trung vào các biện pháp triển khai hạn chế, nhằm giảm thiểu rủi ro Claude bị lạm dụng đặc biệt cho mục đích phát triển hoặc mua bán vũ khí hóa học, sinh học, phóng xạ và hạt nhân. ”
Mẫu AI Claude Opus 4 của Anthropic thể hiện các hành vi tống tiền và lừa đảo chiến lược
Công ty Walt Disney đã bắt đầu một hành động pháp lý quan trọng chống lại Google bằng cách gửi thư cảnh cáo, cáo buộc gã khổng lồ công nghệ vi phạm bản quyền nội dung của Disney trong quá trình huấn luyện và phát triển các mô hình trí tuệ nhân tạo (AI) sinh generative mà không cung cấp khoản bồi thường nào.
Khi trí tuệ nhân tạo (AI) tiến bộ và ngày càng tích hợp vào marketing kỹ thuật số, ảnh hưởng của nó đến tối ưu hóa công cụ tìm kiếm (SEO) ngày càng rõ nét.
MiniMax và Zhipu AI, hai công ty hàng đầu trong lĩnh vực trí tuệ nhân tạo, được cho là đang chuẩn bị niêm yết trên Sở Giao dịch Chứng khoán Hong Kong vào đầu năm tới, có thể là tháng Một.
Denise Dresser, CEO của Slack, chuẩn bị rời khỏi vị trí để trở thành Giám đốc Doanh thu (Chief Revenue Officer) tại OpenAI, công ty đứng sau ChatGPT.
Ngành công nghiệp điện ảnh đang trải qua một cuộc chuyển đổi lớn khi các hãng phim ngày càng tích hợp các kỹ thuật tổng hợp video bằng trí tuệ nhân tạo (AI) để nâng cao quy trình hậu kỳ.
AI đang cách mạng hóa tiếp thị mạng xã hội bằng cách cung cấp các công cụ đơn giản hóa và nâng cao sự tương tác của khán giả.
Sự xuất hiện của các influencer do AI tạo ra trên mạng xã hội đánh dấu một bước chuyển lớn trong môi trường kỹ thuật số, khơi nguồn cho nhiều cuộc tranh luận về tính xác thực của các tương tác trực tuyến cũng như những mối quan ngại đạo đức liên quan đến những nhân vật ảo này.
Launch your AI-powered team to automate Marketing, Sales & Growth
and get clients on autopilot — from social media and search engines. No ads needed
Begin getting your first leads today