Tạp chí Nature: các nhà khoa học kinh ngạc với mô hình ChatGPT mới nhất o1

• OpenAI vừa ra mắt phiên bản preview của mô hình ngôn ngữ lớn mới nhất có tên ChatGPT o1, được đánh giá là bước tiến lớn về khả năng hỗ trợ khoa học của chatbot.

Theo Mario Krenn, trưởng nhóm Artificial Scientist Lab tại Viện Max Planck, o1 cho câu trả lời chi tiết và mạch lạc hơn đáng kể trong lĩnh vực vật lý lượng tử so với mô hình GPT-4o trước đó.

• Điểm nổi bật của o1 là dành nhiều thời gian hơn cho các giai đoạn học tập nhất định và "suy nghĩ" lâu hơn về câu trả lời, giúp nó có khả năng giải quyết các vấn đề phức tạp hơn trong khoa học, lập trình và toán học.

• o1 là mô hình ngôn ngữ lớn đầu tiên đánh bại các học giả cấp tiến sĩ trong bộ câu hỏi khó nhất (Diamond) của bài kiểm tra Graduate-Level Google-Proof Q&A Benchmark (GPQA). o1 đạt điểm tổng thể 78%, trong đó điểm vật lý đặc biệt cao là 93%.

• Trong kỳ thi Olympic Toán học Quốc tế, o1 đạt 83% số câu đúng, vượt xa GPT-4o chỉ đạt 13%.

• o1 sử dụng logic chuỗi suy luận, tự đưa ra các bước lập luận khi giải quyết vấn đề và tự sửa lỗi trong quá trình đó. Tuy nhiên, OpenAI quyết định giữ kín chi tiết chuỗi suy luận.

Các nhà khoa học đánh giá o1 rất hữu ích trong việc đề xuất quy trình thí nghiệm, nhưng cũng lưu ý rằng nó có thể bỏ sót thông tin an toàn quan trọng.

o1 được đánh giá là phù hợp hơn để hướng dẫn chuyên gia hơn là người mới bắt đầu, vì người mới khó có thể phát hiện ra sai sót trong quy trình do o1 tạo ra.

• Các nhà khoa học tin rằng o1 sẽ đẩy nhanh tiến độ nghiên cứu bằng cách hỗ trợ quét tài liệu, phát hiện thiếu sót và đề xuất hướng nghiên cứu mới thú vị.

Kyle Kabasares, nhà khoa học dữ liệu, đã sử dụng o1 để lặp lại một số mã từ dự án tiến sĩ của mình tính toán khối lượng lỗ đen. o1 hoàn thành trong khoảng 1 giờ công việc mà anh mất nhiều tháng để làm.

📌 ChatGPT o1 của OpenAI đánh dấu bước tiến vượt bậc trong khả năng hỗ trợ khoa học của AI, vượt qua các tiến sĩ trong bài kiểm tra GPQA với điểm số 78% và đạt 83% trong kỳ thi Olympic Toán học Quốc tế. Tuy nhiên, các chuyên gia vẫn khuyến cáo cần kiểm tra kỹ kết quả do o1 tạo ra.

https://www.nature.com/articles/d41586-024-03169-9

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo