DeepSeek công bố bản nâng cấp mô hình AI R1-0528 vào ngày 29/5/2025, với khả năng vượt trội về toán học, lập trình và tư duy logic so với phiên bản cũ.
Mô hình mới được đánh giá có chiều sâu lý luận tốt hơn và hiệu suất tổng thể đang tiệm cận các mô hình hàng đầu như OpenAI’s o3 và Google Gemini 2.5 Pro.
R1 ban đầu ra mắt vào tháng 1/2025 đã gây chấn động giới công nghệ toàn cầu khi đạt thành tích ngang ngửa các hệ thống AI Mỹ lớn, nhưng với chi phí phát triển thấp hơn đáng kể.
Sự kiện này khiến nhà sáng lập Liang Wenfeng trở thành một biểu tượng công nghệ tại Trung Quốc và được mệnh danh là "kẻ điên công nghệ" đe dọa vị thế AI của Mỹ.
Tháng 2/2025, Liang được mời tham dự một sự kiện cấp cao do Chủ tịch Tập Cận Bình tổ chức, cùng với các doanh nhân hàng đầu như Jack Ma (Alibaba) và Pony Ma (Tencent).
Sự ra mắt của DeepSeek R1 đã kích thích làn sóng phản ứng trong ngành AI Trung Quốc, với hàng loạt tên tuổi như Alibaba, Zhipu AI, Xiaomi và Baidu nhanh chóng tung ra các mô hình cạnh tranh.
Nâng cấp R1 diễn ra chỉ vài giờ trước báo cáo tài chính của Nvidia, công ty sản xuất chip AI hàng đầu thế giới, từng bị ảnh hưởng khi R1 gốc ra mắt, nhưng đã phục hồi do nhu cầu đầu tư trung tâm dữ liệu AI vẫn mạnh mẽ.
DeepSeek đã đăng tải mô hình nâng cấp R1 trên nền tảng Hugging Face, một động thái nhấn mạnh tính minh bạch và đóng góp cho cộng đồng AI toàn cầu.
📌 DeepSeek gây ấn tượng mạnh với bản nâng cấp R1-0528, cải thiện logic, giảm ảo giác và tiệm cận các mô hình hàng đầu như o3 và Gemini 2.5 Pro. Nhà sáng lập Liang Wenfeng trở thành biểu tượng công nghệ mới của Trung Quốc. Động thái này làm dấy lên làn sóng cạnh tranh AI trong nước và ảnh hưởng đến các ông lớn như Nvidia.
https://www.bloomberg.com/news/articles/2025-05-29/deepseek-says-upgraded-model-reasons-better-hallucinates-less?srnd=phx-ai
DeepSeek cho biết mô hình nâng cấp lý luận tốt hơn, ít ảo giác hơn
Cập nhật của DeepSeek được công bố vào thứ Tư. Nhiếp ảnh gia: Andrey Rudakov/Bloomberg
Bởi Luz Ding 29 tháng 5, 2025 lúc 12:28 PM UTC
Điểm chính
Startup Trung Quốc DeepSeek cho biết hôm thứ Năm rằng mô hình trí tuệ nhân tạo nâng cấp có thể thực hiện toán học, lập trình và logic tổng quát tốt hơn phiên bản trước, đồng thời ít ảo giác hơn.
Việc nâng cấp mô hình R1 - đã làm choáng váng thế giới AI vào tháng 1 bằng cách cạnh tranh với các hệ thống của những nhà phát triển Mỹ lớn hơn nhiều mặc dù được xây dựng với chi phí mà startup Trung Quốc này cho là chỉ bằng một phần nhỏ - có độ sâu lý luận lớn hơn, DeepSeek cho biết trong một bài đăng trên nền tảng mô hình AI Hugging Face.
"Hiệu suất tổng thể hiện đang tiến gần đến các mô hình hàng đầu," như o3 của OpenAI và Gemini 2.5 Pro của Google, công ty cho biết.
Startup có trụ sở tại Hàng Châu đã làm rung chuyển ngành công nghệ toàn cầu vào tháng 1 khi công bố R1 gốc, đặt dấu hỏi cho làn sóng chi tiêu toàn cầu vào tài nguyên tính toán AI và kích hoạt một loạt các bản phát hành AI trong số các công ty Trung Quốc từ Alibaba Group Holding Ltd. đến Zhipu AI.
Sự ra mắt của R1 đã biến người sáng lập DeepSeek Liang Wenfeng thành người nổi tiếng công nghệ và biểu tượng cho khả năng cạnh tranh của Trung Quốc với những công ty tốt nhất của Thung lũng Silicon. Vào tháng 2, Chủ tịch Tập Cận Bình đã mời Liang đến một cuộc tụ họp nổi bật với một số doanh nhân nổi tiếng nhất của đất nước. Người sáng lập trẻ tuổi ngồi cùng với những người như đồng sáng lập Alibaba Jack Ma và Pony Ma của Tencent Holdings Ltd.
Cập nhật R1 của DeepSeek, được gọi là DeepSeek-R1-0528, được công bố vào thứ Tư - chỉ vài giờ trước báo cáo tài chính mới nhất từ Nvidia Corp. có trụ sở tại Santa Clara, California, nhà sản xuất chip AI hàng đầu mà cổ phiếu bị tấn công mạnh ngay sau khi R1 phát hành. Vận may của Nvidia đã phục hồi kể từ đó, khi đầu tư trung tâm dữ liệu AI tiếp tục với tốc độ mạnh, và công ty Mỹ đưa ra dự báo vững chắc cho quý hiện tại.