Microsoft ra mắt Phi-4-Reasoning-Plus với 14 tỷ tham số, mã nguồn mở, lý luận vượt trội

  • Microsoft Research công bố Phi-4-Reasoning-Plus – mô hình ngôn ngữ 14 tỷ tham số chuyên lý luận, mã nguồn mở, mạnh mẽ và tối ưu cho các tác vụ toán học, khoa học, lập trình và logic.

  • Mô hình áp dụng kiến trúc Transformer dạng dense decoder-only, đào tạo trên 16 tỷ token (8,3 tỷ token độc nhất) lấy từ dữ liệu tổng hợp cùng dữ liệu web được chọn lọc.

  • Tinh chỉnh với học tăng cường (reinforcement learning) sử dụng khoảng 6.400 bài toán toán học giúp tăng cường năng lực lý luận của mô hình.

  • Phát hành theo giấy phép MIT dễ dàng cho thương mại, tinh chỉnh, distill, không ràng buộc – tương thích với Hugging Face Transformers, vLLM, llama.cpp và Ollama.

  • Dù chỉ 14 tỷ tham số, Phi-4-Reasoning-Plus vẫn vượt hiệu năng nhiều mô hình lớn hơn như DeepSeek-R1-Distill-70B trên các chuẩn đối chiếu.

  • Trên AIME 2025, mô hình đạt tỉ lệ pass@1 cao hơn Distill-70B (70 tỷ tham số), gần bằng “anh cả” DeepSeek-R1 (671 tỷ tham số).

  • Quá trình huấn luyện nhấn mạnh tách biệt các bước suy luận trung gian với kết quả cuối cùng thông qua token <think> và </think>, tăng độ minh bạch và chặt chẽ trong lập luận.

  • RL sử dụng thuật toán GRPO, tối ưu hóa cân bằng giữa độ chính xác, súc tích, tránh lặp lại, và nhất quán định dạng – giúp mô hình trả lời sâu sắc hơn, đặc biệt với câu hỏi khó.

  • Hỗ trợ ngữ cảnh (context) mặc định 32.000 token, thử nghiệm ổn định đến 64.000 token – thích hợp cho ứng dụng xử lý tài liệu, phân tích pháp lý, mô hình tài chính.

  • Tối ưu cho môi trường hạn chế bộ nhớ/độ trễ, hiệu quả trong chat, tích hợp dễ dàng nhờ hướng dẫn chi tiết về tham số và prompt tối ưu.

  • Microsoft đã kiểm tra an toàn kỹ lưỡng bằng red-team nội bộ và công cụ như Toxigen, khuyến cáo kiểm tra thêm trước khi dùng trong môi trường rủi ro cao.

  • Định dạng xuất suy luận trung gian dễ tích hợp vào hệ thống kiểm toán, hạ tầng logging, nâng cao explainability.

  • Các nhóm kỹ thuật có thể tiết kiệm chi phí hạ tầng, tận dụng mô hình nhỏ nhưng hiệu năng “gần đại gia” cho bài toán thực tế.

  • Mô hình thể hiện khả năng khái quát hoá ra ngoài miền huấn luyện, giải được cả bài toán NP-hard như 3SAT, TSP, ứng dụng mạnh trong hỗ trợ quyết định, hoạch định thuật toán.

  • Dành cho lãnh đạo kỹ thuật doanh nghiệp: giải pháp linh hoạt, dễ mở rộng, kiểm soát rủi ro, tối ưu chi phí trong triển khai AI tạo sinh.

📌 Phi-4-Reasoning-Plus của Microsoft chỉ 14 tỷ tham số nhưng hiệu năng vượt nhiều “ông lớn”, cho phép thương mại, tích hợp linh hoạt, lý luận vượt trội các bài toán toán học, logic, lập trình. Định dạng kết quả tăng tính minh bạch, hỗ trợ phân tích sâu, kiểm toán. An toàn được kiểm thử toàn diện, tối ưu chi phí vận hành cho doanh nghiệp.

 

https://venturebeat.com/ai/microsoft-launches-phi-4-reasoning-plus-a-small-powerful-open-weights-reasoning-model/

Không có file đính kèm.

7

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo