DeepSeek-TNG R1T2 Chimera, một biến thể mới của mô hình DeepSeek R1-0528, vừa được phát hành bởi công ty tư vấn công nghệ TNG Technology Consulting GmbH tại Đức.
R1T2 sử dụng kỹ thuật Assembly-of-Experts (AoE) để kết hợp trọng số từ 3 mô hình mẹ: DeepSeek-R1-0528, DeepSeek-R1 và DeepSeek-V3-0324 – không cần huấn luyện lại.
Theo TNG, R1T2 nhanh hơn 200% so với R1-0528 và nhanh hơn 20% so với bản R1 ban đầu, đồng thời duy trì 90–92% hiệu suất suy luận của R1-0528 trên các bộ đo benchmark như AIME-24, AIME-25 và GPQA-Diamond.
Sự cải tiến về tốc độ đạt được nhờ R1T2 tạo ra phản hồi ngắn gọn hơn, chỉ dùng khoảng 40% số token so với R1-0528, giúp giảm thời gian suy luận và chi phí hạ tầng.
R1T2 phù hợp với môi trường doanh nghiệp yêu cầu suy luận chính xác nhưng phản hồi nhanh, chẳng hạn như các tác vụ logic, toán học, lập trình hoặc trả lời theo định dạng ngắn.
Mô hình được phát hành theo giấy phép MIT, hoàn toàn mã nguồn mở, cho phép doanh nghiệp tùy biến, triển khai nội bộ, hoặc sử dụng trong môi trường bị cách ly (air-gapped).
TNG không khuyến nghị dùng R1T2 cho các tác vụ phức tạp như function-calling hoặc tích hợp công cụ (tool use), nhưng có thể được cập nhật trong tương lai.
So với kiến trúc MoE (Mixture-of-Experts), AoE không chạy từng “expert” theo điều kiện, mà là kết hợp chuyên gia thông qua trọng số, giúp giữ hiệu suất mà không tốn tài nguyên tại thời điểm chạy.
TNG gọi cấu trúc mới là “Tri-Mind”, tận dụng điểm mạnh riêng biệt của từng mô hình gốc: sức mạnh suy luận từ R1-0528, tính tổ chức từ R1, và tính ngắn gọn theo chỉ dẫn từ V3-0324.
Công ty lưu ý doanh nghiệp tại EU cần đánh giá mức độ tuân thủ Đạo luật AI của Liên minh châu Âu (EU AI Act) sẽ có hiệu lực từ ngày 2/8/2025.
R1T2 hiện đã có sẵn trên Hugging Face tại huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera, cùng bài nghiên cứu chi tiết trên arXiv (2506.14794).
TNG – công ty thành lập từ năm 2001, trụ sở tại Bavaria, Đức – có hơn 900 nhân viên, nhiều người có bằng Tiến sĩ, và chuyên cung cấp giải pháp AI, DevOps và điện toán đám mây cho các doanh nghiệp lớn.
📌 DeepSeek R1T2 Chimera từ TNG mang lại tốc độ phản hồi nhanh gấp đôi, giảm 60% độ dài đầu ra nhưng vẫn giữ đến 92% sức mạnh suy luận của bản DeepSeek-R1-0528. Mã nguồn mở, dễ triển khai, tiết kiệm chi phí và phù hợp cho doanh nghiệp cần hiệu suất cao mà không cần độ dài văn bản dư thừa.
https://venturebeat.com/ai/holy-smokes-a-new-200-faster-deepseek-r1-0528-variant-appears-from-german-lab-tng-technology-consulting-gmbh/