Sóng AI-Tri thức tinh gọn về AI & digital

Salesforce công bố báo cáo Salesforce AI Research in Review đầu tiên

Salesforce công bố báo cáo Salesforce AI Research in Review đầu tiên, chia sẻ các thành tựu và nghiên cứu AI nổi bật quý vừa qua, tập trung vào phát triển AI agent đáng tin cậy cho doanh nghiệp.
Vấn đề lớn nhất: "trí thông minh lởm chởm" ở AI - nhiều mô hình AI giải quyết tốt các bài toán phức tạp nhưng lại dễ mắc lỗi với câu hỏi đơn giản, gây khó khăn cho việc triển khai thực tế trong doanh nghiệp cần hiệu quả ổn định.
Salesforce phát triển bộ benchmark SIMPLE gồm 225 câu hỏi suy luận cơ bản, giúp đo lường khả năng lý luận thực tế của AI, tập trung vào các vấn đề mà ít nhất 10% học sinh trung học có thể giải quyết trong một giờ.
SIMPLE không kiểm tra tác vụ phức tạp nhưng giúp doanh nghiệp hiểu sâu về hiệu suất thực tế của mô hình AI, gia tăng sự tin tưởng khi triển khai AI vào các quy trình quan trọng.
Benchmark ContextualJudgeBench đánh giá khả năng của các LLM khi đóng vai trò giám khảo chấm điểm phản hồi, kiểm tra hơn 2.000 cặp phản hồi để đảm bảo tiêu chí công bằng, minh bạch khi đánh giá mô hình AI khác.
Khung đánh giá CRMArena kiểm tra AI agent thực hiện các tác vụ quản lý khách hàng (CRM), như tóm tắt email bán hàng, gợi ý thương mại... Tập trung giải quyết các tác vụ doanh nghiệp thực tiễn thay vì nhiệm vụ học thuật.
Nhiều công nghệ khác được đề cập:
- SFR-Embedding và SFR-Embedding-Code: Chuyển đổi thông tin văn bản, mã lệnh thành dữ liệu cấu trúc phục vụ AI agent.
- SFR-Guard: Đánh giá hiệu suất AI trong các lĩnh vực nhạy cảm (phát hiện độc hại, tấn công prompt...).
- xLAM: Mô hình hỗ trợ đa lượt hội thoại, nhiều phiên bản nhỏ phù hợp nhiều kịch bản.
- TACO: Mô hình multimodal tạo chuỗi tư duy - hành động giải quyết bài toán đa bước phức tạp.

📌 Salesforce đặt nền móng quan trọng cho AI agent doanh nghiệp nhờ các benchmark SIMPLE, ContextualJudgeBench, CRMArena, cùng loạt model tối ưu cho tác vụ thực tiễn, tăng độ tin cậy và hiệu suất ứng dụng trong môi trường doanh nghiệp hiện đại.

https://www.zdnet.com/article/salesforce-research-lays-the-foundations-for-more-reliable-enterprise-ai-agents/

SongAI

Tin nóng

Salesforce công bố báo cáo Salesforce AI Research in Review đầu tiên

Thảo luận

Follow Us

Tin phổ biến

TAG