OpenAI dọa cấm người dùng tìm hiểu cách suy luận của AI Strawberry

• OpenAI đang đe dọa cấm người dùng cố gắng tìm hiểu cách thức suy luận của mô hình AI mới nhất có tên mã là "Strawberry" (được phát hành dưới dạng o1-preview).

Người dùng đang nhận được email từ OpenAI thông báo rằng các yêu cầu của họ đối với ChatGPT đã bị gắn cờ vì "cố gắng phá vỡ các biện pháp bảo vệ". Email cảnh báo rằng vi phạm thêm có thể dẫn đến mất quyền truy cập vào GPT-4o với khả năng Suy luận.

• Điều này mâu thuẫn với việc OpenAI đã quảng bá nhiều về khả năng "chuỗi suy luận" của Strawberry, cho phép AI giải thích cách nó đi đến câu trả lời từng bước một. Giám đốc công nghệ Mira Murati gọi đây là "mô hình mới" cho công nghệ này.

Các báo cáo cho thấy việc sử dụng thuật ngữ "reasoning trace" (dấu vết suy luận) hoặc thậm chí chỉ từ "reasoning" (suy luận) có thể kích hoạt cảnh báo vi phạm từ hệ thống của OpenAI.

OpenAI lập luận rằng họ cần ẩn chuỗi suy luận để không phải đặt bộ lọc lên cách AI suy nghĩ, phòng trường hợp nó nói những điều không tuân thủ chính sách an toàn khi "suy nghĩ thành tiếng".

• Tuy nhiên, công ty cũng thừa nhận biện pháp này giúp duy trì "lợi thế cạnh tranh", ngăn chặn đối thủ cạnh tranh bắt chước.

• Cách tiếp cận này tập trung nhiều trách nhiệm điều chỉnh mô hình ngôn ngữ vào tay OpenAI thay vì dân chủ hóa nó. Điều này gây khó khăn cho các nhóm "red team" - những lập trình viên cố gắng hack các mô hình AI để làm cho chúng an toàn hơn.

• Nhà nghiên cứu AI Simon Willison bày tỏ sự không hài lòng về quyết định chính sách này, cho rằng khả năng diễn giải và tính minh bạch rất quan trọng đối với việc phát triển các mô hình ngôn ngữ lớn.

• Động thái này cho thấy OpenAI đang tiếp tục đi theo hướng giữ các mô hình AI của mình như một "hộp đen" ngày càng mờ mịt hơn.

📌 OpenAI cấm người dùng tìm hiểu cách suy luận của AI Strawberry, đe dọa khóa tài khoản vi phạm. Động thái này mâu thuẫn với quảng cáo về khả năng "chuỗi suy luận" và gây tranh cãi về tính minh bạch. OpenAI lập luận để bảo vệ an toàn và lợi thế cạnh tranh, nhưng các chuyên gia lo ngại về việc tập trung quyền kiểm soát AI.

https://futurism.com/the-byte/openai-ban-strawberry-reasoning

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo