Mistral AI ra mắt Devstral, mô hình ngôn ngữ mã nguồn mở chỉ với 24 tỷ tham số, có thể chạy mượt trên laptop, nhắm đến ứng dụng trong phát triển phần mềm sử dụng AI từ cốt lõi.
Devstral được thiết kế đặc biệt cho SWE Agents – tức là các hệ thống AI có khả năng hiểu, sửa lỗi và thực hiện tác vụ lập trình toàn diện trong mã nguồn lớn.
Mô hình được cấp phép theo Apache 2.0, cho phép tự do thương mại hóa, chỉnh sửa và triển khai, kể cả với các sản phẩm phần mềm độc quyền.
Hiệu năng vượt trội: đạt 46,8% trên bộ dữ liệu kiểm tra SWE-Bench Verified, cao hơn GPT-4.1-mini hơn 20 điểm phần trăm và vượt tất cả các mô hình mã nguồn mở trước đó.
Devstral được huấn luyện từ mô hình Mistral Small 3.1 với kỹ thuật reinforcement learning và căn chỉnh an toàn, tránh việc "học vẹt" theo dữ liệu kiểm tra.
Được tích hợp chặt với các hệ thống scaffold như OpenDevin, SWE-Agent và OpenHands, cho phép AI đọc code, hiểu logic, chỉnh sửa và xử lý nhiều bước phức tạp trong dự án.
So với các mô hình mã hóa trước như Codestral, Devstral chuyển hướng từ hoàn thành mã ngắn sang hành động như lập trình viên thực thụ, xử lý các vấn đề trong thế giới thực.
Hỗ trợ bối cảnh 128.000 token, tokenizer Tekken với 131.000 từ vựng.
Có thể triển khai qua các nền tảng mã nguồn mở như Hugging Face, Ollama, Kaggle, LM Studio, Unsloth và hoạt động tốt với vLLM, Transformers, Mistral Inference.
Có thể sử dụng qua API (devstral-small-2505) hoặc chạy cục bộ, với giá 0,10 USD/triệu token đầu vào và 0,30 USD/triệu token đầu ra.
Dễ dàng tích hợp vào quy trình phát triển: cập nhật phiên bản gói, chỉnh sửa đoạn mã, phát hiện đúng nơi cần sửa và thực hiện lệnh theo yêu cầu.
Phiên bản hiện tại là preview nghiên cứu, Mistral và All Hands AI đang phát triển bản lớn hơn. Tuy nhiên, phiên bản nhỏ đã đạt hiệu năng vượt xa mong đợi so với mô hình lớn.
📌 Devstral – mô hình AI mã nguồn mở mới của Mistral – đạt 46,8% trên SWE-Bench, vượt GPT-4.1-mini hơn 20%. Với chỉ 24 tỷ tham số, Devstral có thể chạy cục bộ trên laptop và được cấp phép Apache 2.0, giúp các nhà phát triển dễ dàng tùy biến, tích hợp và thương mại hóa trong mọi môi trường.
https://venturebeat.com/ai/mistral-ai-launches-devstral-powerful-new-open-source-swe-agent-model-that-runs-on-laptops/