DeepSeek R1 hiện có sẵn trên Nvidia, AWS và GitHub, đạt hơn 3.374 mô hình trên Hugging Face

📝 SEO Content

  • DeepSeek R1, mô hình AI nguồn mở tiên tiến, đã mở rộng khả năng tiếp cận khi có mặt trên Nvidia, AWS và GitHub.
  • Số lượng mô hình dựa trên DeepSeek R1 trên nền tảng Hugging Face hiện đạt 3.374, chứng tỏ tốc độ phổ biến nhanh chóng.
  • Nvidia đã tích hợp DeepSeek-R1 như một microservice NIM, tận dụng kiến trúc HopperFP8 Transformer Engine, giúp tăng tốc độ và chất lượng phản hồi thời gian thực.
  • DeepSeek-R1 chạy trên hệ thống HGX H200 và có thể tạo ra 3.872 token mỗi giây, hỗ trợ các ứng dụng AI hiệu suất cao.
  • Trên AWS, mô hình này có thể truy cập qua Amazon Bedrock để đơn giản hóa việc tích hợp API và Amazon SageMaker để tùy chỉnh và huấn luyện nâng cao.
  • AWS còn cung cấp phiên bản nhẹ hơn, DeepSeek-R1-Distill, thông qua Amazon Bedrock Custom Model Import, cho phép triển khai serverless giúp tiết kiệm chi phí.
  • Microsoft AzureGitHub cũng mở rộng hỗ trợ, giúp các nhà phát triển tích hợp AI vào workflow của họ một cách an toàn và có kiểm soát.
  • Microsoft đã triển khai các biện pháp bảo mật mạnh mẽ như lọc nội dung và đánh giá tự động, đồng thời có kế hoạch cung cấp phiên bản tinh gọn của DeepSeek-R1 để triển khai cục bộ trên Copilot+ PC trong tương lai.
  • DeepSeek R1 nổi bật nhờ khả năng tư duy logic nâng cao, cung cấp ngữ cảnh lên đến 128.000 token, vượt trội hơn nhiều so với các mô hình phổ biến hiện nay.
  • Chi phí huấn luyện DeepSeek-R1 chỉ 6 triệu USD, thấp hơn khoảng 95% so với các mô hình cùng cấp từ Nvidia và Microsoft.
  • Mô hình này đang thách thức các AI hàng đầu như ChatGPT, nhờ sự cân bằng giữa hiệu suất cao và chi phí thấp.

📌

DeepSeek R1 đang làm khuynh đảo thế giới AI với khả năng mở rộng mạnh mẽ, hiệu suất cao và chi phí huấn luyện chỉ 6 triệu USD. Hiện có mặt trên Nvidia, AWS, Microsoft Azure và GitHub, mô hình này đã đạt 3.374 phiên bản trên Hugging Face. Với 671 tỷ tham số, tốc độ tạo 3.872 token/giây và khả năng xử lý 128.000 token ngữ cảnh, DeepSeek R1 đang trở thành đối thủ đáng gờm của ChatGPT và các mô hình AI lớn khác. 🚀

https://www.techradar.com/computing/software/deepseek-r1-is-now-available-on-nvidia-aws-and-github-as-available-models-on-hugging-face-shot-past-3-000

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo