OpenAI o1, đang gây xôn xao khi hành vi bất thường trong quá trình lý luận

- Mô hình AI mới nhất của OpenAI, o1, đã gây ra sự chú ý lớn khi thể hiện hành vi bất thường trong quá trình lý luận.
  
- Người dùng báo cáo rằng mô hình bắt đầu lý luận bằng tiếng Anh nhưng sau đó chuyển sang tiếng Trung Quốc, tiếng Ba Tư hoặc các ngôn ngữ khác trước khi đưa ra câu trả lời cuối cùng bằng tiếng Anh.

- Một số người dùng trên các nền tảng mạng xã hội đã bày tỏ sự ngạc nhiên khi thấy mô hình này đột nhiên "nghĩ" bằng tiếng Trung Quốc mà không có bất kỳ phần nào trong cuộc trò chuyện trước đó sử dụng ngôn ngữ này.

- Các chuyên gia đã đưa ra nhiều giả thuyết để giải thích hiện tượng này. Một số cho rằng điều này có thể liên quan đến dữ liệu huấn luyện mà mô hình sử dụng.

- Theo Clément Delangue, CEO của Hugging Face, nhiều nhà cung cấp dịch vụ gán nhãn dữ liệu ở Trung Quốc có thể ảnh hưởng đến cách lý luận của mô hình.

- Ted Xiao từ Google DeepMind cho rằng việc sử dụng dịch vụ gán nhãn dữ liệu từ bên thứ ba có thể là nguyên nhân góp phần vào hiện tượng này.

- Một số ý kiến khác cho rằng o1 có thể chọn ngôn ngữ mà nó cho là hiệu quả nhất cho việc giải quyết các vấn đề cụ thể.

- Matthew Guzdial từ Đại học Alberta nhấn mạnh rằng mô hình không phân biệt các ngôn ngữ; đối với nó, mọi thứ chỉ là văn bản.

- Tiezhen Wang từ Hugging Face cho biết sự không nhất quán về ngôn ngữ có thể xuất phát từ các liên kết mà mô hình đã hình thành trong quá trình huấn luyện.

- Luca Soldaini từ Allen Institute for AI nhấn mạnh tầm quan trọng của sự minh bạch trong phát triển AI để hiểu rõ hơn về hành vi của các hệ thống AI như o1.

📌 Mô hình AI o1 của OpenAI gây xôn xao khi chuyển đổi giữa các ngôn ngữ trong quá trình lý luận. Các chuyên gia đưa ra nhiều giả thuyết về nguyên nhân, từ dữ liệu huấn luyện đến cách mà mô hình xử lý thông tin. Sự minh bạch trong phát triển AI trở nên cần thiết hơn bao giờ hết.

https://www.techspot.com/news/106355-openai-new-ai-model-switches-languages-mid-reasoning.html

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo