- NVIDIA công bố dòng mô hình ngôn ngữ lớn nguồn mở Llama Nemotron, xây dựng trên nền tảng Llama - bộ mô hình đã được tải xuống hơn 650 triệu lần
- Dòng sản phẩm bao gồm hai họ mô hình chính:
- Llama Nemotron: Tập trung vào xử lý ngôn ngữ
- Cosmos Nemotron: Chuyên về thị giác-ngôn ngữ
- Ba phiên bản mô hình được cung cấp:
- Nano: Tối ưu cho ứng dụng thời gian thực, độ trễ thấp
- Super: Độ chính xác cao, hiệu suất tốt trên một GPU
- Ultra: Độ chính xác cao nhất, thiết kế cho quy mô trung tâm dữ liệu
- Các tính năng chính của nền tảng:
- Tích hợp dịch vụ vi mô NVIDIA NIM
- Hỗ trợ tìm kiếm và tóm tắt video
- Khả năng tùy chỉnh cho từng doanh nghiệp
- Tích hợp NVIDIA NeMo Retriever để kết nối với dữ liệu doanh nghiệp
- Các đối tác hàng đầu đã áp dụng:
- SAP với nền tảng Joule
- ServiceNow cho dịch vụ AI tác tử
- Mô hình được tối ưu hóa thông qua:
- Kỹ thuật cắt tỉa (pruning)
- Huấn luyện với bộ dữ liệu chất lượng cao
- Tích hợp khả năng theo dõi hướng dẫn, trò chuyện, lập trình
- Tính khả dụng:
- Miễn phí cho thành viên NVIDIA Developer Program
- Triển khai thương mại thông qua nền tảng NVIDIA AI Enterprise
- Hỗ trợ đa dạng môi trường: đám mây, trung tâm dữ liệu, máy tính cá nhân
📌 NVIDIA định hình lại tương lai AI tác tử với dòng Nemotron, cung cấp giải pháp toàn diện từ biên đến trung tâm dữ liệu. Mô hình nguồn mở Llama đạt 650 triệu lượt tải xuống, kết hợp 3 phiên bản (Nano, Super, Ultra) đáp ứng mọi nhu cầu triển khai.
https://blogs.nvidia.com/blog/nemotron-model-families/