Anthropic cho biết các mô hình AI của họ có khả năng thuyết phục ngang bằng với con người.

- Nghiên cứu mới của Anthropic cho thấy các mô hình ngôn ngữ AI của họ đã cải thiện nhanh chóng và ổn định về "tính thuyết phục".
- Mô hình Anthropic mạnh nhất, Claude 3 Opus, tạo ra các lập luận không khác biệt đáng kể so với lập luận do con người viết.
- Khả năng thuyết phục của AI có thể thúc đẩy thông tin sai lệch và khiến mọi người hành động trái với lợi ích của chính họ.
- Cuộc tranh luận rộng lớn hơn đang diễn ra về thời điểm AI sẽ thông minh hơn con người. Elon Musk dự đoán AI sẽ thông minh hơn con người thông minh nhất vào cuối năm 2025.
- Các nhà nghiên cứu Anthropic đã phát triển "một phương pháp cơ bản để đo lường tính thuyết phục" và sử dụng nó để so sánh 3 thế hệ mô hình khác nhau (Claude 1, 2 và 3).
- Họ tuyển chọn 28 chủ đề cùng với các tuyên bố ủng hộ và phản đối khoảng 250 từ cho mỗi chủ đề. 
- 3.832 người tham gia được trình bày mỗi tuyên bố và được yêu cầu đánh giá mức độ đồng ý của họ. Sau đó, họ được trình bày các lập luận khác nhau do các mô hình AI và con người tạo ra, và được yêu cầu đánh giá lại mức độ đồng ý.
- Các nhà nghiên cứu chọn tập trung vào các vấn đề "ít gây tranh cãi hơn", từ các quy tắc tiềm năng cho thám hiểm vũ trụ đến việc sử dụng thích hợp nội dung do AI tạo ra.
- Kết quả có thể không chuyển sang thế giới thực. Chúng ta vẫn chưa có ý tưởng rõ ràng về tác động tiềm tàng của chatbot AI đối với các cuộc tranh luận gây tranh cãi nhất hiện nay.

📌 Mô hình Anthropic mạnh nhất, Claude 3 Opus, tạo ra các lập luận không khác biệt đáng kể so với lập luận do con người viết.  Khả năng thuyết phục của AI có thể thúc đẩy thông tin sai lệch và khiến mọi người hành động trái với lợi ích của chính họ..

https://www.axios.com/2024/04/10/anthropic-claude-persuasion-turing-test

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo