DeepSeek nâng cấp mô hình AI R1 giảm hiện tượng ảo giác

 

  • DeepSeek công bố bản nâng cấp mô hình AI R1-0528 vào ngày 29/5/2025, với khả năng vượt trội về toán học, lập trình và tư duy logic so với phiên bản cũ.

  • Mô hình mới được đánh giá có chiều sâu lý luận tốt hơn và hiệu suất tổng thể đang tiệm cận các mô hình hàng đầu như OpenAI’s o3 và Google Gemini 2.5 Pro.

  • R1 ban đầu ra mắt vào tháng 1/2025 đã gây chấn động giới công nghệ toàn cầu khi đạt thành tích ngang ngửa các hệ thống AI Mỹ lớn, nhưng với chi phí phát triển thấp hơn đáng kể.

  • Sự kiện này khiến nhà sáng lập Liang Wenfeng trở thành một biểu tượng công nghệ tại Trung Quốc và được mệnh danh là "kẻ điên công nghệ" đe dọa vị thế AI của Mỹ.

  • Tháng 2/2025, Liang được mời tham dự một sự kiện cấp cao do Chủ tịch Tập Cận Bình tổ chức, cùng với các doanh nhân hàng đầu như Jack Ma (Alibaba) và Pony Ma (Tencent).

  • Sự ra mắt của DeepSeek R1 đã kích thích làn sóng phản ứng trong ngành AI Trung Quốc, với hàng loạt tên tuổi như Alibaba, Zhipu AI, Xiaomi và Baidu nhanh chóng tung ra các mô hình cạnh tranh.

  • Nâng cấp R1 diễn ra chỉ vài giờ trước báo cáo tài chính của Nvidia, công ty sản xuất chip AI hàng đầu thế giới, từng bị ảnh hưởng khi R1 gốc ra mắt, nhưng đã phục hồi do nhu cầu đầu tư trung tâm dữ liệu AI vẫn mạnh mẽ.

  • DeepSeek đã đăng tải mô hình nâng cấp R1 trên nền tảng Hugging Face, một động thái nhấn mạnh tính minh bạch và đóng góp cho cộng đồng AI toàn cầu.

📌 DeepSeek gây ấn tượng mạnh với bản nâng cấp R1-0528, cải thiện logic, giảm ảo giác và tiệm cận các mô hình hàng đầu như o3 và Gemini 2.5 Pro. Nhà sáng lập Liang Wenfeng trở thành biểu tượng công nghệ mới của Trung Quốc. Động thái này làm dấy lên làn sóng cạnh tranh AI trong nước và ảnh hưởng đến các ông lớn như Nvidia.

https://www.bloomberg.com/news/articles/2025-05-29/deepseek-says-upgraded-model-reasons-better-hallucinates-less?srnd=phx-ai

 

DeepSeek cho biết mô hình nâng cấp lý luận tốt hơn, ít ảo giác hơn

Cập nhật của DeepSeek được công bố vào thứ Tư. Nhiếp ảnh gia: Andrey Rudakov/Bloomberg

Bởi Luz Ding 29 tháng 5, 2025 lúc 12:28 PM UTC

Điểm chính

  • Mô hình AI nâng cấp của DeepSeek, R1, có thể thực hiện toán học, lập trình và logic tổng quát tốt hơn phiên bản trước, đồng thời ít ảo giác hơn.
  • Mô hình mới có độ sâu lý luận lớn hơn và hiệu suất tổng thể hiện đang tiến gần đến các mô hình hàng đầu, như o3 của OpenAI và Gemini 2.5 Pro của Google.
  • Mô hình R1 gốc, phát hành vào tháng 1, đã làm choáng váng thế giới AI và biến người sáng lập DeepSeek Liang Wenfeng thành người nổi tiếng công nghệ, tượng trưng cho khả năng cạnh tranh của Trung Quốc với Thung lũng Silicon.

Startup Trung Quốc DeepSeek cho biết hôm thứ Năm rằng mô hình trí tuệ nhân tạo nâng cấp có thể thực hiện toán học, lập trình và logic tổng quát tốt hơn phiên bản trước, đồng thời ít ảo giác hơn.

Việc nâng cấp mô hình R1 - đã làm choáng váng thế giới AI vào tháng 1 bằng cách cạnh tranh với các hệ thống của những nhà phát triển Mỹ lớn hơn nhiều mặc dù được xây dựng với chi phí mà startup Trung Quốc này cho là chỉ bằng một phần nhỏ - có độ sâu lý luận lớn hơn, DeepSeek cho biết trong một bài đăng trên nền tảng mô hình AI Hugging Face.

"Hiệu suất tổng thể hiện đang tiến gần đến các mô hình hàng đầu," như o3 của OpenAI và Gemini 2.5 Pro của Google, công ty cho biết.

Startup có trụ sở tại Hàng Châu đã làm rung chuyển ngành công nghệ toàn cầu vào tháng 1 khi công bố R1 gốc, đặt dấu hỏi cho làn sóng chi tiêu toàn cầu vào tài nguyên tính toán AI và kích hoạt một loạt các bản phát hành AI trong số các công ty Trung Quốc từ Alibaba Group Holding Ltd. đến Zhipu AI.

Sự ra mắt của R1 đã biến người sáng lập DeepSeek Liang Wenfeng thành người nổi tiếng công nghệ và biểu tượng cho khả năng cạnh tranh của Trung Quốc với những công ty tốt nhất của Thung lũng Silicon. Vào tháng 2, Chủ tịch Tập Cận Bình đã mời Liang đến một cuộc tụ họp nổi bật với một số doanh nhân nổi tiếng nhất của đất nước. Người sáng lập trẻ tuổi ngồi cùng với những người như đồng sáng lập Alibaba Jack Ma và Pony Ma của Tencent Holdings Ltd.

Cập nhật R1 của DeepSeek, được gọi là DeepSeek-R1-0528, được công bố vào thứ Tư - chỉ vài giờ trước báo cáo tài chính mới nhất từ Nvidia Corp. có trụ sở tại Santa Clara, California, nhà sản xuất chip AI hàng đầu mà cổ phiếu bị tấn công mạnh ngay sau khi R1 phát hành. Vận may của Nvidia đã phục hồi kể từ đó, khi đầu tư trung tâm dữ liệu AI tiếp tục với tốc độ mạnh, và công ty Mỹ đưa ra dự báo vững chắc cho quý hiện tại.

DeepSeek Says Upgraded Model Reasons Better, Hallucinates Less

 
 
  • DeepSeek's upgraded AI model, R1, can perform mathematics, programming, and general logic better than the previous version, while hallucinating less.
    Summary by Bloomberg AI
  • The new model features a greater depth of reasoning and its overall performance is now approaching that of leading models, such as OpenAI's o3 and Google's Gemini 2.5 Pro.
    Summary by Bloomberg AI
  • The original R1 model, released in January, stunned the AI world and turned DeepSeek founder Liang Wenfeng into a tech celebrity, symbolizing China's ability to compete with Silicon Valley.
     
 
The Chinese startup DeepSeek said Thursday that its upgraded artificial-intelligence model can perform mathematics, programming, and general logic better than the previous version, while hallucinating less.
The upgrade to its R1 model — which stunned the AI world in January by rivaling the systems of much-larger US developers despite being built at what the Chinese startup said was a fraction of the cost — features a greater depth of reasoning, DeepSeek said in a post on the AI model platform Hugging Face.
“Its overall performance is now approaching that of leading models,” such as OpenAI’s o3 and Google’s Gemini 2.5 Pro, the company said.
The Hangzhou-based startup rocked the global tech industry in January when it unveiled the original R1, throwing into question the worldwide flood of spending on AI computational resources and touching off a flurry of AI releases among Chinese players from Alibaba Group Holding Ltd. to Zhipu AI.
The debut of R1 turned DeepSeek founder Liang Wenfeng into a tech celebrity and a symbol of China’s ability to compete with the best of Silicon Valley. In February, President Xi Jinping invited Liang to a high-profile gathering with some of the country’s most prominent entrepreneurs. The young founder was seated among the likes of Alibaba co-founder Jack Ma and Tencent Holdings Ltd.’s Pony Ma.
DeepSeek’s update to R1, known as DeepSeek-R1-0528, was announced on Wednesday — just hours before the latest financial report from Santa Clara, California-based Nvidia Corp., the leading maker of AI chips whose shares were pummeled in the immediate wake of R1’s release. Nvidia’s fortunes have recovered since, as AI data center investment has continued at a strong pace, and the US company offered a solid forecast for the current quarter.

Không có file đính kèm.

21

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo