- DeepSeek, phòng nghiên cứu AI của Trung quốc, vừa ra mắt mô hình DeepSeek-R1 với hai phiên bản: DeepSeek-R1 và DeepSeek-R1-Zero, nhằm nâng cao khả năng lý luận và phân tích
- Mô hình sử dụng kiến trúc mixture-of-experts giống như phiên bản V3 trước đó, với chi phí thấp hơn đáng kể so với các đối thủ như Meta và OpenAI
- 6 ứng dụng nổi bật của DeepSeek-R1:
1. Ứng dụng di động: Chạy mượt mà trên điện thoại thông minh với phiên bản 1.5B
2. Đồ họa động: Tạo hình tam giác xoay với quả bóng đỏ bằng Python
3. Xử lý tài liệu: Xây dựng ứng dụng RAG để trò chuyện với file PDF
4. Tính toán phân tán: Chạy trên hệ thống 7 máy Mac mini M4 Pro và MacBook Pro M4 Max với bộ nhớ 496GB
5. Ứng dụng web: Vận hành trực tiếp trên trình duyệt web với tốc độ 60 token/giây
6. Phát triển nhanh: Tạo bản sao của công cụ tìm kiếm Perplexity AI trong vòng 1 giờ
- Người dùng có thể truy cập DeepSeek-R1 qua:
- Giao diện DeepSeek Chat tại chat.deepseek.com
- API từ DeepSeek Developer Portal
- Cấu hình API client với URL api.deepseek.com
📌 DeepSeek-R1 đang thách thức vị thế của OpenAI với mô hình nguồn mở có khả năng chạy trên nhiều nền tảng, từ điện thoại đến máy tính. Phiên bản 1.5B cho hiệu suất vượt trội GPT-4 và Claude 3.5 trong các bài toán, với chi phí thấp hơn đáng kể.
https://indianexpress.com/article/technology/artificial-intelligence/deepseek-r1-is-taking-the-ai-community-by-storm-some-wild-use-cases-9795163/