Nghiên cứu mới của Anthropic về cách tạo tính cách cho AI giải thích Claude giống người

- Chatbot AI Claude 3 hiện là chatbot giống con người nhất, kết quả của quá trình tinh chỉnh mới mà Anthropic triển khai: huấn luyện tính cách.
- Mục tiêu là giúp Claude có các đặc điểm tinh tế và phong phú hơn như tò mò, cởi mở và chu đáo. Điều này xảy ra trong giai đoạn liên kết khi các giá trị và mục tiêu của con người được nhúng vào các mô hình ngôn ngữ lớn (LLM).
- Thay vì huấn luyện Claude áp dụng quan điểm của người trò chuyện, bám chặt vào một quan điểm duy nhất hoặc giả vờ không có ý kiến hay thiên vị, họ huấn luyện nó trung thực về bất kỳ quan điểm nào nó nghiêng về sau khi được đào tạo.
- Anthropic đã lập danh sách các đặc điểm tính cách mà họ muốn khuyến khích, sau đó huấn luyện vào Claude. Chatbot được yêu cầu tạo ra các tin nhắn liên quan đến một đặc điểm cụ thể, chẳng hạn như các câu hỏi về giá trị, và sau đó được hiển thị các đặc điểm tính cách.
- Mặc dù pipeline huấn luyện này chỉ sử dụng dữ liệu tổng hợp do chính Claude tạo ra, việc xây dựng và điều chỉnh các đặc điểm là một quá trình tương đối thủ công, dựa vào các nhà nghiên cứu kiểm tra chặt chẽ cách mỗi đặc điểm thay đổi hành vi của mô hình.
- Cách tiếp cận của Anthropic có thể sẽ phát triển theo thời gian. Họ nhấn mạnh rằng vẫn còn nhiều câu hỏi phức tạp cần xem xét như liệu các mô hình AI có nên có tính cách mạch lạc hay chúng nên có thể tùy chỉnh hơn.

📌 Anthropic đã công bố nghiên cứu về huấn luyện tính cách cho AI, giải thích lý do chatbot Claude giống con người. Quá trình kết hợp triết học và kỹ thuật này nhằm tạo ra các đặc điểm phong phú, tinh tế như tò mò, cởi mở, chu đáo. Mặc dù còn nhiều câu hỏi phức tạp cần xem xét, cách tiếp cận của Anthropic hứa hẹn sẽ tiếp tục phát triển để tạo ra các chatbot AI ngày càng giống con người hơn.

https://www.tomsguide.com/ai/anthropic-just-published-research-on-how-to-give-ai-a-personality-is-this-why-claude-is-so-human-like

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo