AI models AI mở-nguồn mở 2025-07-04 09:22:06

DeepSeek R1T2 mới từ Đức nhanh gấp 2 lần bản gốc, vẫn giữ sức mạnh suy luận

DeepSeek-TNG R1T2 Chimera, một biến thể mới của mô hình DeepSeek R1-0528, vừa được phát hành bởi công ty tư vấn công nghệ TNG Technology Consulting GmbH tại Đức.
R1T2 sử dụng kỹ thuật Assembly-of-Experts (AoE) để kết hợp trọng số từ 3 mô hình mẹ: DeepSeek-R1-0528, DeepSeek-R1 và DeepSeek-V3-0324 – không cần huấn luyện lại.
Theo TNG, R1T2 nhanh hơn 200% so với R1-0528 và nhanh hơn 20% so với bản R1 ban đầu, đồng thời duy trì 90–92% hiệu suất suy luận của R1-0528 trên các bộ đo benchmark như AIME-24, AIME-25 và GPQA-Diamond.
Sự cải tiến về tốc độ đạt được nhờ R1T2 tạo ra phản hồi ngắn gọn hơn, chỉ dùng khoảng 40% số token so với R1-0528, giúp giảm thời gian suy luận và chi phí hạ tầng.
R1T2 phù hợp với môi trường doanh nghiệp yêu cầu suy luận chính xác nhưng phản hồi nhanh, chẳng hạn như các tác vụ logic, toán học, lập trình hoặc trả lời theo định dạng ngắn.
Mô hình được phát hành theo giấy phép MIT, hoàn toàn mã nguồn mở, cho phép doanh nghiệp tùy biến, triển khai nội bộ, hoặc sử dụng trong môi trường bị cách ly (air-gapped).
TNG không khuyến nghị dùng R1T2 cho các tác vụ phức tạp như function-calling hoặc tích hợp công cụ (tool use), nhưng có thể được cập nhật trong tương lai.
So với kiến trúc MoE (Mixture-of-Experts), AoE không chạy từng “expert” theo điều kiện, mà là kết hợp chuyên gia thông qua trọng số, giúp giữ hiệu suất mà không tốn tài nguyên tại thời điểm chạy.
TNG gọi cấu trúc mới là “Tri-Mind”, tận dụng điểm mạnh riêng biệt của từng mô hình gốc: sức mạnh suy luận từ R1-0528, tính tổ chức từ R1, và tính ngắn gọn theo chỉ dẫn từ V3-0324.
Công ty lưu ý doanh nghiệp tại EU cần đánh giá mức độ tuân thủ Đạo luật AI của Liên minh châu Âu (EU AI Act) sẽ có hiệu lực từ ngày 2/8/2025.
R1T2 hiện đã có sẵn trên Hugging Face tại huggingface.co/tngtech/DeepSeek-TNG-R1T2-Chimera, cùng bài nghiên cứu chi tiết trên arXiv (2506.14794).
TNG – công ty thành lập từ năm 2001, trụ sở tại Bavaria, Đức – có hơn 900 nhân viên, nhiều người có bằng Tiến sĩ, và chuyên cung cấp giải pháp AI, DevOps và điện toán đám mây cho các doanh nghiệp lớn.

📌 DeepSeek R1T2 Chimera từ TNG mang lại tốc độ phản hồi nhanh gấp đôi, giảm 60% độ dài đầu ra nhưng vẫn giữ đến 92% sức mạnh suy luận của bản DeepSeek-R1-0528. Mã nguồn mở, dễ triển khai, tiết kiệm chi phí và phù hợp cho doanh nghiệp cần hiệu suất cao mà không cần độ dài văn bản dư thừa.

https://venturebeat.com/ai/holy-smokes-a-new-200-faster-deepseek-r1-0528-variant-appears-from-german-lab-tng-technology-consulting-gmbh/

Không có file đính kèm.

Nguồn tham khảo

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng

DeepSeek R1T2 mới từ Đức nhanh gấp 2 lần bản gốc, vẫn giữ sức mạnh suy luận

Thảo luận

Follow Us

Tin phổ biến

TAG