DeepSeek, startup AI tại Hàng Châu, vừa công bố bản cập nhật V3.1 cho mô hình AI thế hệ V3.
Điểm nổi bật nhất của V3.1 là “cửa sổ ngữ cảnh dài” (longer context window), cho phép xử lý và ghi nhớ nhiều thông tin hơn trong một truy vấn.
Tính năng này giúp mô hình duy trì hội thoại dài hơi, tăng khả năng hồi tưởng và tạo phản hồi mạch lạc hơn.
Thông tin được đăng trên nhóm chính thức WeChat của DeepSeek, tuy nhiên chưa có tài liệu kỹ thuật trên các nền tảng như Hugging Face.
DeepSeek không công bố chi tiết kiến trúc, số tham số hay dữ liệu huấn luyện của V3.1, giữ lại sự mập mờ chiến lược để tạo sức tò mò cho cộng đồng.
Sự phát triển của DeepSeek cho thấy Trung Quốc đang đẩy mạnh AI tạo sinh với chi phí thấp hơn nhưng hiệu quả cao, gây sức ép lên các công ty Mỹ như OpenAI.
Trước đó, DeepSeek đã gây chấn động khi ra mắt mô hình R1, vượt trội nhiều đối thủ phương Tây trên các bài kiểm tra chuẩn hóa.
R1 được đánh giá là bước ngoặt, chứng minh khả năng Trung Quốc trong việc cạnh tranh trực tiếp với các công ty AI hàng đầu thế giới.
Người hâm mộ đang mong chờ R2, bản kế nhiệm R1, nhưng vẫn bị trì hoãn do CEO Liang Wenfeng bị cho là quá cầu toàn và gặp một số trục trặc kỹ thuật.
Sự chậm trễ này tạo nên kỳ vọng R2 sẽ vượt trội hơn R1 cả về độ chính xác lẫn tốc độ.
DeepSeek hiện được xem là một trong những công ty AI Trung Quốc có tốc độ phát triển nhanh nhất, sánh ngang với các startup công nghệ Mỹ.
Cộng đồng AI quốc tế đang theo dõi sát sao sự tiến triển của V3.1 cũng như động thái công bố R2.
DeepSeek ra mắt V3.1, mở rộng cửa sổ ngữ cảnh giúp hội thoại mạch lạc và ghi nhớ dài hơn. Thành công trước đó với R1 đã chứng minh năng lực AI tạo sinh của Trung Quốc, gây sức ép lên OpenAI và các đối thủ Mỹ. Trong khi cộng đồng đang mong chờ R2, sự xuất hiện của V3.1 cho thấy DeepSeek không ngừng đổi mới. Dù chi phí thấp hơn, họ vẫn đạt kết quả ấn tượng, củng cố hình ảnh dẫn đầu trong AI.
https://www.bloomberg.com/news/articles/2025-08-19/china-s-deepseek-release-v3-1-boosting-ai-model-s-capabilities