- Phiên bản cập nhật mới nhất của GPT-4 Turbo (gpt-4-turbo-2024-04-09) đã giành lại vị trí số 1 trong bảng xếp hạng Chatbot Arena của LMSYS kể từ ngày 9/4/2024.
- GPT-4 Turbo vượt trội hơn các mô hình ngôn ngữ lớn khác về khả năng lập trình và lập luận, dựa trên hơn 8.000 lượt bình chọn của người dùng từ nhiều lĩnh vực.
- Người dùng có thể so sánh đồng thời 2 mô hình AI trên Chatbot Arena mà không biết danh tính của chúng, và đánh giá câu trả lời để xác định mô hình chiến thắng.
- Kết quả được sử dụng để xếp hạng 82 mô hình ngôn ngữ lớn trên bảng xếp hạng, bao gồm Gemini Pro, dòng Claude 3 và Mistral-Large-2402.
- Tính đến ngày 13/4/2024, GPT-4 Turbo dẫn đầu hạng mục tổng thể, lập trình và tiếng Anh, trong khi Claude 3 Opus xếp thứ 2 và phiên bản cũ hơn gpt-4-1106-preview xếp thứ 3.
- Hiệu suất cải thiện của gpt-4-turbo-2024-04-09 là nhờ khả năng lập trình, toán học, lập luận logic và viết lách vượt trội, được chứng minh qua các bài kiểm tra đánh giá trình độ mô hình AI.
📌 GPT-4 Turbo đã giành lại ngôi vị số 1 trong bảng xếp hạng Chatbot Arena, vượt qua Claude 3 Opus nhờ khả năng lập trình, toán học và lập luận logic vượt trội. Tính đến ngày 13/4/2024, mô hình mới gpt-4-turbo-2024-04-09 dẫn đầu hạng mục tổng thể, lập trình và tiếng Anh, cho thấy sự cải tiến đáng kể so với phiên bản trước.
Citations:
[1] https://www.zdnet.com/article/gpt-4-turbo-reclaims-best-ai-model-crown-from-anthropics-claude-3/