• Salesforce vừa công bố mô hình AI xLAM-1B, được gọi là "Tiny Giant", chỉ có 1 tỷ tham số nhưng vượt trội các mô hình lớn hơn nhiều trong các tác vụ gọi hàm, bao gồm cả các mô hình từ OpenAI và Anthropic.
• Thành công của xLAM-1B đến từ phương pháp tiếp cận sáng tạo của Salesforce AI Research trong việc tạo dữ liệu. Họ đã phát triển APIGen, một pipeline tự động tạo ra các bộ dữ liệu chất lượng cao, đa dạng và có thể xác minh để huấn luyện các mô hình AI trong các ứng dụng gọi hàm.
• Mô hình xLAM-1B đạt hiệu suất vượt trội, vượt qua GPT-3.5-Turbo và Claude-3 Haiku trong các đánh giá trên Berkeley Function-Calling Benchmark.
• Kích thước nhỏ gọn của xLAM-1B làm cho nó phù hợp cho các ứng dụng trên thiết bị, nơi các mô hình lớn hơn không thực tế. Điều này có ý nghĩa quan trọng đối với AI doanh nghiệp, cho phép tạo ra các trợ lý AI mạnh mẽ và phản hồi nhanh hơn có thể chạy cục bộ trên smartphone hoặc các thiết bị có tài nguyên tính toán hạn chế.
• Chìa khóa thành công của xLAM-1B nằm ở chất lượng và sự đa dạng của dữ liệu huấn luyện. Pipeline APIGen tận dụng 3.673 API có thể thực thi trên 21 danh mục khác nhau, với mỗi điểm dữ liệu trải qua quy trình xác minh ba giai đoạn nghiêm ngặt.
• Phương pháp này đại diện cho một sự thay đổi đáng kể trong chiến lược phát triển AI. Trong khi nhiều công ty đang chạy đua để xây dựng các mô hình ngày càng lớn hơn, phương pháp của Salesforce cho thấy việc tạo dữ liệu thông minh hơn có thể dẫn đến các hệ thống AI hiệu quả và hiệu suất cao hơn.
• Thành công của xLAM-1B có thể thúc đẩy sự phát triển của các ứng dụng AI trên thiết bị. Hiện tại, nhiều tính năng AI tiên tiến phụ thuộc vào điện toán đám mây do kích thước và độ phức tạp của các mô hình. Nếu các mô hình nhỏ hơn như xLAM-1B có thể cung cấp khả năng tương tự, nó có thể cho phép các trợ lý AI mạnh mẽ hơn chạy trực tiếp trên thiết bị của người dùng.
• Nhóm nghiên cứu đã công khai bộ dữ liệu gồm 60.000 ví dụ gọi hàm chất lượng cao, một động thái có thể thúc đẩy tiến bộ trong lĩnh vực này.
• CEO Salesforce Marc Benioff đã ca ngợi thành tựu này trên Twitter, nhấn mạnh tiềm năng cho "AI tác nhân trên thiết bị". Sự phát triển này có thể đánh dấu một bước chuyển lớn trong bối cảnh AI, thách thức quan niệm rằng các mô hình lớn hơn luôn tốt hơn.
• Thành công của xLAM-1B có thể thúc đẩy một làn sóng phát triển AI mới tập trung vào việc tạo ra các mô hình siêu hiệu quả được thiết kế cho các tác vụ cụ thể, thay vì các mô hình khổng lồ đa năng.
📌 Salesforce đã tạo ra bước đột phá với mô hình AI xLAM-1B chỉ 1 tỷ tham số nhưng vượt trội các đối thủ lớn hơn. Thành công này có thể thay đổi cách tiếp cận phát triển AI, hướng tới các mô hình nhỏ gọn, hiệu quả cho ứng dụng trên thiết bị, mở ra kỷ nguyên mới cho AI phân tán và tiết kiệm năng lượng.
https://venturebeat.com/ai/salesforce-proves-less-is-more-xlam-1b-tiny-giant-beats-bigger-ai-models/