OpenAI thừa nhận GPT-4.5 vẫn bị tỷ lệ ảo giác lên đến 37%

  • OpenAI thừa nhận mô hình ngôn ngữ lớn GPT-4.5 mới ra mắt có tỷ lệ ảo giác (tạo ra thông tin sai lệch một cách tự tin) lên đến 37% trong các bài kiểm tra.

  • Công ty đang cố gắng xoay chuyển vấn đề này thành điểm tích cực, vì mô hình mới có tỷ lệ ảo giác thấp hơn so với các mô hình khác của họ.

  • Theo đồ thị được trình bày, GPT-4o (được quảng cáo là mô hình "lý luận" tiên tiến) có tỷ lệ ảo giác lên tới 61,8% trong bài kiểm tra SimpleQA.

  • Mô hình o3-mini của OpenAI, một phiên bản nhỏ hơn và rẻ hơn, thậm chí còn tệ hơn với tỷ lệ ảo giác lên đến 80,3%.

  • Vấn đề này không chỉ giới hạn ở OpenAI, các mô hình AI tốt nhất hiện nay chỉ có thể tạo ra văn bản không có ảo giác khoảng 35% thời gian, theo Wenting Zhao, nghiên cứu sinh tiến sĩ tại Cornell.

  • Zhao cảnh báo rằng chúng ta vẫn chưa thể hoàn toàn tin tưởng vào kết quả từ các mô hình AI.

  • Điều đáng ngạc nhiên là OpenAI đang nhận được hàng trăm tỷ đô la đầu tư cho các sản phẩm có vấn đề nghiêm trọng về tính xác thực.

  • Ngành công nghiệp AI đang bán cho người dùng những hệ thống tốn kém, tiêu thụ nhiều tài nguyên mà vẫn không thể đảm bảo chính xác các sự kiện cơ bản.

  • Hiệu suất của các mô hình LLM của OpenAI đang có dấu hiệu đạt đến ngưỡng, buộc công ty phải tìm cách lấy lại sự phấn khích ban đầu khi ChatGPT được ra mắt.

  • Để thực sự tiến bộ, ngành AI cần một bước đột phá thực sự, không chỉ là cải tiến nhỏ từ những mô hình hiện có.

📌 Mô hình GPT-4.5 mới nhất của OpenAI vẫn tạo ra thông tin sai lệch 37% thời gian, trong khi các mô hình khác như GPT-4o và o3-mini thậm chí còn tệ hơn với tỷ lệ ảo giác lần lượt là 61,8% và 80,3%. Thực tế này đặt ra câu hỏi lớn về giá trị thực của một công ty được định giá hàng trăm tỷ đô la.

 

https://futurism.com/openai-admits-gpt45-hallucinates

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo