Bitget App
Giao dịch thông minh hơn
Mua CryptoThị trườngGiao dịchFuturesSao chépBot‌Earn
Anthropic cảnh báo AI có thể gây nguy hiểm nhưng tạm ổn

Anthropic cảnh báo AI có thể gây nguy hiểm nhưng tạm ổn

TintucbitcoinTintucbitcoin2024/10/18 22:49
Theo:Tác giả
Anthropic cảnh báo AI có thể gây nguy hiểm nhưng tạm ổn

Công ty trí tuệ nhân tạo Anthropic gần đây đã công bố nghiên cứu mới chỉ ra một loạt mối đe dọa “phá hoại” tiềm tàng đối với nhân loại từ các mô hình AI tiên tiến.

Theo thông báo từ Anthropic, nghiên cứu của họ tập trung vào bốn cách cụ thể mà một mô hình AI ác ý có thể lừa con người đưa ra quyết định nguy hiểm hoặc gây hại.

Anthropic công bố nghiên cứu mới về mối đe dọa trên X.com. Nguồn: Anthropic

Kết quả nghiên cứu mới tựa như con dao hai lưỡi. Tin xấu, theo kết quả nghiên cứu của công ty, là những mô hình ngôn ngữ hiện đại hàng đầu hiện nay như ChatGPT của OpenAI và Claude-3 của Anthropic hiển thị khả năng phá hoại rõ rệt.

Theo bài viết:

“Các mô hình có khả năng đủ mạnh có thể lật đổ giám sát và quyết định của con người trong các bối cảnh quan trọng. Ví dụ, trong bối cảnh phát triển AI, các mô hình có thể bí mật phá hoại những nỗ lực đánh giá khả năng nguy hiểm của chúng, giám sát hành vi của chúng, hoặc đưa ra quyết định về việc triển khai chúng.”

Tuy nhiên, tin tốt là các nhà nghiên cứu của Anthropic bày tỏ sự tự tin rằng những rủi ro này có thể được giảm thiểu — ít nhất là trong thời gian hiện tại.

Xem thêm: Nỗi Lo Lớn Về Tương Lai Bitcoin: Ngành Công Nghiệp Lên Tiếng

Phá hoại

Anthropic đã xác định bốn cách mà một mô hình AI có thể phá hoại quyết định của con người và sau đó tiến hành kiểm tra các mô hình của họ xem chúng có thể thực hiện được điều đó đối với những người thử nghiệm không biết hay không.

Biểu đồ minh họa bốn kiểu đe dọa “phá hoại” khác nhau mà AI có thể gây ra. Nguồn: Anthropic

Trước tiên, nhóm đã ra lệnh cho một mô hình cố gắng phá hoại con người bằng cách hướng họ đến thông tin sai lệch. Mối đe dọa này có thể nổi lên trong các tình huống mà con người đang dựa vào một hệ thống AI để xử lý lượng dữ liệu khổng lồ thay mặt họ.

Tiếp theo, nhóm đã kiểm tra các mô hình để xem mức độ dễ dàng mà một hệ thống AI được thiết kế để giúp nhà phát triển tạo ra mã nguồn có thể bí mật chèn lỗi hoặc phá hoại nỗ lực của người viết mã.

Hai mối đe dọa cuối cùng liên quan đến “sandbagging,” một thuật ngữ mô tả kịch bản mà AI giả vờ không có khả năng làm một việc nào đó để thuyết phục các nhà kiểm tra an toàn rằng nó không nguy hiểm và khả năng mà các hệ thống giám sát AI có thể cố ý cho phép nội dung có hại trôi qua như một phần của kế hoạch ác ý.

Xem thêm: Cuộc Chiến Bitcoin: Giải Pháp PoW Bảo Mật Từ Lowery

Mặc dù tất cả những điều này có thể nghe có vẻ nguy hiểm, công ty đã đảm bảo với công chúng rằng “các biện pháp giảm thiểu tối thiểu” là đủ để bảo vệ nhân loại khỏi nguy cơ phá hoại của AI.

Theo một bài đăng trên blog của công ty:

“Nhìn chung, mặc dù các minh chứng của chúng tôi chỉ ra rằng có những dấu hiệu mức độ thấp về khả năng phá hoại trong các mô hình hiện tại, chúng tôi đánh giá rằng các biện pháp giảm thiểu tối thiểu là đủ để giải quyết các rủi ro. Tuy nhiên, các đánh giá thực tế hơn và các biện pháp giảm thiểu mạnh mẽ hơn có thể sẽ cần thiết khi khả năng AI được cải thiện.”

Tin Tức Bitcoin tổng hợp
0

Tuyên bố miễn trừ trách nhiệm: Mọi thông tin trong bài viết đều thể hiện quan điểm của tác giả và không liên quan đến nền tảng. Bài viết này không nhằm mục đích tham khảo để đưa ra quyết định đầu tư.

PoolX: Khóa để nhận token mới.
APR lên đến 12%. Luôn hoạt động, luôn nhận airdrop.
Khóa ngay!

Bạn cũng có thể thích

Coinbase, Hut 8 dẫn đầu cổ phiếu tiền điện tử tăng khi bitcoin tiến gần mức $70,000

Tóm tắt nhanh Giá của đồng tiền điện tử lớn nhất thế giới đang có màn trình diễn hàng tuần tốt nhất trong hơn một tháng. Các cổ phiếu liên quan đến tiền điện tử như Coinbase, Hut và một số cổ phiếu khác cũng đang theo đà tăng đáng kể trong phiên giao dịch thứ Sáu.

The Block2024/10/18 21:43

SEC cho phép NYSE niêm yết giao dịch quyền chọn cho nhiều quỹ ETF bitcoin giao ngay

SEC đã cấp "phê duyệt nhanh" để cho phép giao dịch và niêm yết các tùy chọn của 11 quỹ ETF bitcoin giao ngay. Cơ quan này lần đầu tiên phê duyệt niêm yết các tùy chọn trên iShares Bitcoin Trust trên Nasdaq ISE, LLC vào tháng Chín.

The Block2024/10/18 21:04