• Databricks công bố bản xem trước công khai của Mosaic AI Agent Framework và Agent Evaluation tại Data + AI Summit 2024, nhằm hỗ trợ các nhà phát triển xây dựng và triển khai ứng dụng Agent và Retrieval Augmented Generation (RAG) chất lượng cao.
• Các thách thức chính khi xây dựng ứng dụng AI tạo sinh chất lượng cao bao gồm: chọn đúng chỉ số đánh giá chất lượng, thu thập phản hồi của con người hiệu quả, xác định nguyên nhân gốc rễ của vấn đề chất lượng và cải thiện nhanh chóng trước khi triển khai.
• Mosaic AI Agent Framework và Agent Evaluation cung cấp các tính năng chính:
- Tích hợp phản hồi của con người: Cho phép định nghĩa phản hồi chất lượng cao bằng cách mời chuyên gia đánh giá.
- Các chỉ số đánh giá toàn diện: Đo lường độ chính xác, ảo tưởng, độ nguy hại và hữu ích của ứng dụng.
- Quy trình phát triển end-to-end: Tích hợp với MLflow để ghi nhật ký và đánh giá ứng dụng.
- Quản lý vòng đời ứng dụng: SDK đơn giản hóa để quản lý toàn bộ vòng đời ứng dụng.
• Databricks cung cấp ví dụ về xây dựng ứng dụng RAG chất lượng cao, bao gồm kết nối với chỉ mục tìm kiếm vector, sử dụng LangChain retriever và tận dụng MLflow.
• Một số công ty đã áp dụng thành công Mosaic AI Agent Framework:
- Corning xây dựng trợ lý nghiên cứu AI lập chỉ mục hàng trăm nghìn tài liệu.
- Lippert sử dụng để đánh giá kết quả ứng dụng AI tạo sinh.
- FordDirect tạo chatbot thống nhất cho các đại lý.
• Giá Agent Evaluation dựa trên yêu cầu đánh giá, còn Mosaic AI Model Serving theo mức giá riêng.
• Databricks khuyến khích khách hàng dùng thử bằng cách truy cập tài liệu, notebook demo và Generative AI Cookbook.
📌 Databricks ra mắt Mosaic AI Agent Framework và Agent Evaluation, giúp xây dựng ứng dụng AI tạo sinh chất lượng cao với tính năng tích hợp phản hồi người dùng, đánh giá toàn diện và quản lý vòng đời. Các công ty như Corning, Lippert và FordDirect đã áp dụng thành công, cải thiện đáng kể chất lượng và hiệu suất ứng dụng AI.
https://www.marktechpost.com/2024/07/26/databricks-announced-the-public-preview-of-mosaic-ai-agent-framework-and-agent-evaluation/