- Anthropic vừa phát hành phiên bản mới Claude 3, đạt kỷ lục mới trong các bài kiểm tra đánh giá LLM.
- Bên cạnh đó, Anthropic cũng công bố lời nhắc hệ thống của Claude, vạch ra quan điểm và nguyên tắc hoạt động của mô hình này.
- Lời nhắc hệ thống chỉ ra Claude sẽ trả lời ngắn gọn các câu hỏi đơn giản, nhưng cung cấp câu trả lời chi tiết cho các câu hỏi phức tạp, miễn là quan điểm được chia sẻ bởi đa số mọi người. Claude cũng tránh định kiến tiêu cực.
- Các chuyên gia hoan nghênh sự minh bạch của Anthropic và cho rằng các công ty khác nên làm tương tự. Tuy nhiên, họ cũng chỉ ra rằng đây mới chỉ là bước đầu, chưa phản ánh toàn bộ cách thức hoạt động của mô hình.
- Một số ý kiến lo ngại rằng việc công bố lời nhắc hệ thống có thể là cách để Anthropic trút bỏ trách nhiệm về các đầu ra không mong muốn của mô hình.
- Ngoài lời nhắc hệ thống, cách thức hoạt động của các công cụ AI tạo sinh còn phụ thuộc vào dữ liệu huấn luyện, quá trình tinh chỉnh, các biện pháp bảo vệ và tương tác người dùng.
📌 Việc Anthropic công bố lời nhắc hệ thống của chatbot Claude 3 là một bước tiến đáng kể trong tính minh bạch của các mô hình ngôn ngữ lớn. Tuy nhiên, đây mới chỉ là khởi đầu, chưa phản ánh toàn diện cách thức hoạt động phức tạp của các công cụ AI tạo sinh vốn còn phụ thuộc vào nhiều yếu tố khác như dữ liệu huấn luyện, tinh chỉnh và tương tác người dùng.
https://www.fastcompany.com/91053339/anthropic-claude-3-system-prompt-transparency