- StarCoder 2 là một AI tạo mã lệnh có thể chạy trên hầu hết các GPU, bao gồm Nvidia A100, và có thể được tinh chỉnh trong vài giờ để tạo ra các ứng dụng như chatbot và trợ lý lập trình cá nhân.
- AI này được đào tạo trên một bộ dữ liệu lớn và đa dạng hơn so với phiên bản đầu tiên của StarCoder, với khoảng 619 ngôn ngữ lập trình, giúp nó đưa ra dự đoán chính xác và nhận thức ngữ cảnh tốt hơn.
- Các nhà phát triển đang ngày càng sử dụng các dịch vụ tạo mã lệnh hỗ trợ bởi AI như GitHub Copilot và Amazon CodeWhisperer, cũng như các mô hình nguồn mở như Meta’s Code Llama.
- Hugging Face đã hợp tác với ServiceNow để tạo ra StarCoder, một trình tạo mã nguồn mở với giấy phép ít hạn chế hơn so với các công cụ khác.
- StarCoder 2 không phải là một mô hình đơn lẻ mà là một gia đình mô hình, bao gồm ba biến thể, hai trong số đó có thể chạy trên hầu hết các GPU tiêu dùng hiện đại.
- StarCoder 2 được đào tạo với lượng dữ liệu gấp 4 lần so với StarCoder gốc (67.5 terabytes so với 6.4 terabytes), mang lại hiệu suất cải thiện đáng kể với chi phí vận hành thấp hơn.
- StarCoder 2, với tư cách là một bộ sưu tập các mô hình nguồn mở, còn có thể triển khai một cách địa phương và "học" mã nguồn hoặc cơ sở mã của nhà phát triển.
📌 StarCoder 2 đánh dấu một bước tiến quan trọng trong lĩnh vực AI tạo mã lệnh, không chỉ với khả năng chạy trên nhiều loại GPU mà còn với khả năng tinh chỉnh nhanh chóng và hỗ trợ đa dạng ngôn ngữ lập trình. Sự cải thiện về hiệu suất, được đào tạo trên bộ dữ liệu lớn hơn với 67.5 terabytes so với 6.4 terabytes của phiên bản trước, cho phép StarCoder 2 đưa ra dự đoán chính xác hơn và phù hợp với ngữ cảnh cụ thể của người dùng. Điều này, cùng với việc là một dự án nguồn mở, giúp StarCoder 2 trở thành một công cụ hấp dẫn cho các nhà phát triển, đặc biệt là khi nó có thể triển khai địa phương và học hỏi từ mã nguồn của họ, mang lại lợi ích trong việc tạo ra các ứng dụng lập trình cá nhân hóa.
Citations:
[1] https://techcrunch.com/2024/02/28/starcoder-2-is-a-code-generating-ai-that-runs-on-most-gpus/