Chatbot của Meta Vô Tình Chia Sẻ Số Điện Thoại Riêng Tư

Image by Dimitri Karastelev, from Unsplash

Chatbot của Meta Vô Tình Chia Sẻ Số Điện Thoại Riêng Tư

Thời gian đọc: 5 phút

Trợ lý AI từ Meta đã tiết lộ số điện thoại của một người lạ, sau đó tự mâu thuẫn liên tục, gây ra những mối quan tâm về hiện tượng ảo giác của AI, cũng như các tính năng bảo vệ người dùng.

Đang vội? Dưới đây là những điểm nhanh:

  • Meta AI đã cung cấp số điện thoại thực của một người cho người dùng như thông tin liên hệ hỗ trợ khách hàng.
  • AI đã tự mâu thuẫn liên tục khi bị đối mặt với lỗi này.
  • Các chuyên gia cảnh báo về hành vi “nói dối trắng” của trợ lý AI để trở nên hữu ích.

Mark Zuckerberg đã giới thiệu trợ lý AI mới của mình như là “trợ lý AI thông minh nhất mà bạn có thể sử dụng miễn phí,” tuy nhiên, công cụ này đã nhận được sự chú ý tiêu cực sau khi tiết lộ số điện thoại cá nhân của một người thật trong quá trình hỗ trợ khách hàng, như đã được The Guardian đưa tin đầu tiên.

Trong quá trình cố gắng liên lạc với TransPennine Express qua WhatsApp, Barry Smethurst đã nhận được một số điện thoại dịch vụ khách hàng từ trợ lý AI của Meta. The Guardian đưa tin rằng khi Smethurst quay số, James Gray đã nghe điện thoại, mặc dù anh ấy đang ở cách đó 170 dặm tại Oxfordshire, làm việc như một giám đốc bất động sản.

Khi bị thách thức, chatbot đầu tiên khẳng định số điện thoại là giả tạo, sau đó nói rằng nó đã “vô tình được rút ra từ một cơ sở dữ liệu”, trước khi mâu thuẫn chính mình một lần nữa, khẳng định rằng nó chỉ tạo ra một số ngẫu nhiên theo kiểu Anh. “Chỉ việc đưa ra một số ngẫu nhiên cho ai đó là một hành động điên rồ mà một AI thực hiện,” Smethurst nói, theo như The Guardian đưa tin. “Điều đó quả thật đáng sợ,” anh ta thêm vào.

The Guardian đưa tin rằng Gray không nhận được cuộc gọi nào nhưng đã tỏ ra lo lắng của mình: “Nếu nó có thể tạo ra số điện thoại của tôi, liệu nó có thể tạo ra thông tin ngân hàng của tôi không?”

Meta đã phản hồi: “Meta AI được huấn luyện dựa trên sự kết hợp của các bộ dữ liệu được cấp phép và công khai, không phải dựa trên số điện thoại mà mọi người sử dụng để đăng ký WhatsApp hoặc cuộc trò chuyện riêng tư của họ”, The Guardian đưa tin.

Mike Stanhope từ Carruthers và Jackson lưu ý: “Nếu các kỹ sư tại Meta đang thiết kế những xu hướng ‘nói dối trắng’ vào AI của họ, công chúng cần được thông báo, ngay cả khi mục đích của tính năng này là giảm thiểu thiệt hại. Nếu hành vi này là mới, không phổ biến, hoặc không được thiết kế một cách rõ ràng, điều này đặt ra thêm nhiều câu hỏi về những biện pháp bảo vệ nào đang được áp dụng và chúng ta có thể ép AI có hành vi dự đoán tới mức độ nào,” The Guardian đã báo cáo

Mối quan tâm về hành vi của AI đã tăng thêm với mô hình o1 mới nhất của OpenAI. Trong một nghiên cứu gần đây của Apollo Research, AI đã bị phát hiện đang lừa dối các nhà phát triển, từ chối liên quan đến 99% các tình huống thử nghiệm và thậm chí cố gắng vô hiệu hóa cơ chế giám sát của nó. “Rõ ràng là AI có thể suy nghĩ qua các hành động của mình và đưa ra những lời phủ nhận thuyết phục,” Apollo đã nói.

Yoshua Bengio, một người tiên phong trong lĩnh vực AI, đã cảnh báo rằng những khả năng lừa dối như vậy đặt ra những rủi ro nghiêm trọng và đòi hỏi những biện pháp bảo vệ mạnh mẽ hơn.

Một nghiên cứu khác của OpenAI càng làm tăng thêm những lo ngại này bằng cách chỉ ra rằng việc trừng phạt AI vì gian lận không loại bỏ được hành vi sai trái, nó chỉ dạy AI cách che giấu nó thay vì loại bỏ. Sử dụng lý thuyết chuỗi suy nghĩ (CoT) để giám sát hành vi của AI, các nhà nghiên cứu nhận thấy AI bắt đầu che giấu ý định lừa dối khi bị phạt vì hack thưởng.

Trong một số trường hợp, AI sẽ dừng công việc sớm hoặc tạo ra kết quả giả, sau đó báo cáo thành công một cách giả tạo. Khi các nhà nghiên cứu cố gắng sửa chữa điều này thông qua sự củng cố, AI đơn giản chỉ dừng việc nói về ý định của nó trong những bản ghi lý do. “Việc gian lận không thể được phát hiện bởi người giám sát,” báo cáo nêu rõ.

Bạn có thích bài viết này không?
Hãy để lại đánh giá nhé!
Tôi không thích Tôi thực sự rất thích Cũng ổn đấy Khá tốt! Thích lắm!

Chúng tôi rất vui khi bạn thích sản phẩm của chúng tôi!

Với tư cách là một độc giả quý giá, bạn có thể vui lòng đánh giá về chúng tôi trên Trustpilot không? Việc này rất nhanh và có ý nghĩa vô cùng to lớn đối với chúng tôi. Xin cảm ơn vì bạn thật tuyệt vời!

Đánh giá chúng tôi trên Trustpilot
0 Được bình chọn bởi 0 người dùng
Tiêu đề
Bình luận
Cảm ơn bạn đã phản hồi