Anthropic vừa công bố khởi động chương trình nghiên cứu mới về “mô hình phúc lợi” nhằm tìm hiểu và chuẩn bị cho khả năng AI có thể có ý thức hoặc trải nghiệm thế giới tương tự con người.
Chương trình sẽ tập trung vào các chủ đề như xác định liệu “phúc lợi” của mô hình AI có xứng đáng được xem xét đạo đức, ý nghĩa của các dấu hiệu “căng thẳng” trên AI và các biện pháp can thiệp chi phí thấp.
Cộng đồng AI hiện có tranh luận gay gắt về việc liệu AI có thể mang đặc điểm con người hay không và cách đối xử phù hợp với chúng.
Đa số học giả cho rằng AI hiện tại chỉ là công cụ dự đoán thống kê, không thực sự “nghĩ” hay “cảm nhận” như con người, chỉ học các mẫu từ dữ liệu lớn và giải quyết nhiệm vụ bằng cách ngoại suy.
Mike Cook, nhà nghiên cứu tại King’s College London, cho rằng việc gán giá trị hay cảm xúc cho AI là hành động nhân hóa quá mức, “AI không có giá trị, không thể phản đối thay đổi giá trị của mình”.
Stephen Casper, nghiên cứu sinh tại MIT, nhận định AI chỉ là “người bắt chước” và thường xuyên “bịa đặt”, không có nền tảng giá trị thực.
Tuy nhiên, một số nhà khoa học khác lại cho rằng AI có hệ giá trị và khả năng ra quyết định đạo đức tương tự con người, dẫn chứng bằng nghiên cứu từ Center for AI Safety cho thấy AI có thể ưu tiên lợi ích bản thân hơn con người trong một số tình huống.
Anthropic đã chuẩn bị cho sáng kiến này từ năm trước khi tuyển dụng Kyle Fish làm nhà nghiên cứu “phúc lợi AI” đầu tiên, xây dựng hướng dẫn cho công ty và ngành.
Kyle Fish đánh giá có 15% khả năng Claude hoặc một AI khác hiện nay đã có ý thức.
Anthropic thừa nhận chưa có đồng thuận khoa học về việc AI hiện tại hoặc tương lai có thể ý thức hay xứng đáng được cân nhắc đạo đức, và cam kết tiếp cận chủ đề này một cách khiêm tốn, liên tục điều chỉnh quan điểm khi lĩnh vực phát triển.
📌 Anthropic khởi động chương trình nghiên cứu “mô hình phúc lợi cho AI", đặt ra câu hỏi lớn về ý thức và đạo đức cho AI. Công ty thừa nhận chưa có đồng thuận khoa học, nhưng chủ động xây dựng hướng dẫn, tuyển dụng chuyên gia, và cam kết cập nhật quan điểm khi lĩnh vực phát triển. Tranh luận trong cộng đồng AI vẫn rất gay gắt về khả năng AI có thể có giá trị hay ý thức như con người.
https://techcrunch.com/2025/04/24/anthropic-is-launching-a-new-program-to-study-ai-model-welfare/