Hunyuan Turbo S của Tencent: đối thủ đáng gờm của DeepSeek

  • Tencent, công ty công nghệ có trụ sở tại Thâm Quyến, Trung Quốc, vừa công bố nền tảng AI mới có tên Hunyuan Turbo S, được thiết kế đặc biệt để cạnh tranh với DeepSeek.

  • Theo công ty và báo cáo từ Reuters, Hunyuan Turbo S có khả năng phản hồi đầu vào và truy vấn của người dùng trong vòng một giây, thậm chí nhanh hơn cả DeepSeek-R1, mặc dù chưa có đánh giá chuẩn tốc độ độc lập nào xác nhận điều này.

  • Về đánh giá chuẩn tiếng Trung, Hunyuan Turbo S đứng đầu trong các bài kiểm tra của CMMLU, nhưng DeepSeek-R1-Zero dẫn đầu trong đánh giá của C-Eval.

  • Trong lĩnh vực alignment (liên kết), Hunyuan Turbo S vượt trội hơn GPT-4o, Claude 3.5, Llama 3.1, và DeepSeek-V3 trong đánh giá từ LiveBench, nhưng lại thua nhẹ Claude 3.5 trong đánh giá từ IF-Eval.

  • Về toán học, Hunyuan Turbo S vượt qua GPT-4o, Claude 3.5, Llama 3.1 và DeepSeek-V3 trong một số tiêu chuẩn, nhưng DeepSeek-R1-Zero dẫn đầu tất cả theo đánh giá của AIME 2024 và MATH.

  • Về kiến thức, Hunyuan Turbo S xếp hạng tương đối cao trên hầu hết các đánh giá chuẩn kiến thức, nhưng không thể sánh bằng DeepSeek-R1-Zero trong các đánh giá từ MMLU, MMLU-Pro và SimpleQA.

  • Về lập luận, Hunyuan Turbo S chỉ xếp hạng cao thứ ba, sau GPT-4o và Claude 3.5, trong các đánh giá lập luận của BBH.

  • Về khả năng lập trình, HumanEval đặt Hunyuan Turbo S ngay sau Claude, nhưng khá thua xa DeepSeek-V3, DeepSeek-R1-Zero và GPT-4o theo kết quả của LiveCodeBench.

  • Mặc dù Hunyuan Turbo S là người chiến thắng rõ ràng trong một số trường hợp, nhưng vẫn thua DeepSeek-R1-Zero trong nhiều trường hợp khác.

  • Nền tảng Hunyuan Turbo S mới của Tencent củng cố vị thế của gã khổng lồ công nghệ Trung Quốc trong cuộc đua phát triển nền tảng AI nhanh nhất và mạnh mẽ nhất.

  • Dù không phải là bước đầu tiên của Tencent vào thế giới công cụ AI tạo sinh, Hunyuan Turbo S là sản phẩm đáng chú ý nhất của công ty cho đến nay và chắc chắn là một đối thủ đáng theo dõi trong những tuần, tháng và năm tới.

📌 Nền tảng Hunyuan Turbo S của Tencent trở thành đối thủ mạnh trong lĩnh vực AI với khả năng phản hồi dưới 1 giây. Mô hình này vượt trội trong một số đánh giá chuẩn nhưng vẫn thua DeepSeek-R1-Zero trong nhiều trường hợp, đặc biệt là toán học, kiến thức và lập trình.

 

https://www.eweek.com/artificial-intelligence/tencent-hunyuan-turbo-s-deepseek-competitor-benchmarks/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo