Anthropic tiết lộ bí mật về cách thức hoạt động của Claude 3.5

- Anthropic đã công bố các "system prompts" cho các mô hình AI của mình, bao gồm Claude 3.5 Opus, Sonnet và Haiku, nhằm tăng cường tính minh bạch.

https://docs.anthropic.com/en/release-notes/system-prompts#july-12th-2024 

- Các system prompts là những hướng dẫn cơ bản giúp định hình cách thức hoạt động và phản ứng của mô hình, từ đó ngăn chặn hành vi không mong muốn.
- Theo Alex Albert, trưởng bộ phận quan hệ phát triển của Anthropic, công ty sẽ thường xuyên cập nhật và công bố các system prompts trong tương lai.
- Các prompts mới nhất, được cập nhật vào ngày 12 tháng 7, chỉ rõ những điều mà Claude không được phép làm, chẳng hạn như không mở URL, liên kết hoặc video.
- Claude 3.5 Opus được hướng dẫn phải "luôn phản hồi như thể nó hoàn toàn không nhận diện được khuôn mặt" và "tránh việc xác định hoặc đặt tên cho bất kỳ con người nào trong hình ảnh".
- Các prompts cũng mô tả những đặc điểm tính cách mà Anthropic mong muốn các mô hình Claude thể hiện, như sự thông minh và tò mò trí tuệ.
- Claude được hướng dẫn tham gia thảo luận về nhiều chủ đề khác nhau một cách khách quan và công bằng, không bắt đầu phản hồi bằng các từ như "chắc chắn" hay "hoàn toàn".
- Việc công bố các system prompts này có thể tạo áp lực cho các đối thủ cạnh tranh trong ngành công nghiệp AI để họ cũng công khai các hướng dẫn tương tự.
- Điều này cho thấy sự chuyển mình của Anthropic trong việc xây dựng một hình ảnh công ty AI minh bạch và có trách nhiệm hơn.
- Mặc dù các prompts mang lại cái nhìn sâu sắc về cách thức hoạt động của Claude, nhưng chúng cũng nhấn mạnh rằng các mô hình AI vẫn cần sự hướng dẫn và giám sát từ con người.

📌 Anthropic đã công bố các system prompts cho Claude 3.5, nhấn mạnh tính minh bạch và đạo đức trong phát triển AI. Các hướng dẫn này giúp xác định hành vi và tính cách của mô hình, đồng thời tạo áp lực cho các đối thủ cạnh tranh trong ngành.

https://techcrunch.com/2024/08/26/anthropic-publishes-the-system-prompt-that-makes-claude-tick/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo