- Genspark, startup có trụ sở tại Palo Alto, vừa ra mắt Super Agent - hệ thống AI tự động có khả năng xử lý nhiều tác vụ thực tế đa dạng, bao gồm cả việc gọi điện đặt bàn nhà hàng bằng giọng nói tổng hợp chân thực.
- Super Agent được xây dựng dựa trên 3 trụ cột chính: tổ hợp 9 mô hình LLM khác nhau, hơn 80 công cụ và hơn 10 bộ dữ liệu độc quyền - tất cả hoạt động cùng nhau trong một luồng phối hợp.
- Trong bản demo, Super Agent đã lập kế hoạch cho chuyến đi San Diego 5 ngày, tính toán khoảng cách đi bộ giữa các điểm tham quan, lập bản đồ các tùy chọn giao thông công cộng và sử dụng agent gọi điện để đặt nhà hàng, bao gồm cả việc xử lý thông tin về dị ứng thực phẩm và sở thích chỗ ngồi.
- Genspark tuyên bố đã vượt qua Manus (startup Trung Quốc) với điểm số 87,8% trên tiêu chuẩn GAIA - cao hơn mức 86% của Manus - và làm được điều này với kiến trúc bao gồm các thành phần độc quyền và phạm vi công cụ rộng hơn.
- Super Agent hiển thị rõ ràng quá trình suy nghĩ, theo dõi cách nó lập luận qua từng bước, công cụ nào được sử dụng và tại sao, giúp hệ thống cảm giác ít bí ẩn hơn và giống như một đối tác hợp tác.
- Genspark đã gây ấn tượng với giao diện khởi động mượt mà trong trình duyệt mà không cần thiết lập kỹ thuật. Người dùng có thể bắt đầu thử nghiệm mà không cần thông tin cá nhân, khác với Manus yêu cầu người dùng tham gia danh sách chờ và cung cấp tài khoản mạng xã hội.
- Startup này đã huy động được ít nhất 160 triệu USD qua hai vòng gọi vốn, được hỗ trợ bởi các nhà đầu tư từ Mỹ và Singapore.
- Cách tiếp cận của Genspark nổi bật vì giải quyết được thách thức kỹ thuật AI lâu đời: điều phối công cụ ở quy mô lớn. Super Agent có vẻ quản lý tốt hơn bằng cách sử dụng định tuyến mô hình và lựa chọn dựa trên truy xuất để chọn công cụ và mô hình phụ một cách linh hoạt dựa trên nhiệm vụ.
- Chiến lược này tương đồng với nghiên cứu mới nổi về CoTools, một framework mới từ Đại học Soochow ở Trung Quốc giúp cải thiện cách LLM sử dụng bộ công cụ mở rộng và phát triển.
- Trong khi các công ty công nghệ lớn như Microsoft, OpenAI và Amazon thận trọng với các giải pháp agent của họ, Genspark đã thể hiện tham vọng lớn hơn với khả năng tự chủ cao hơn.
- Mặc dù doanh nghiệp có thể không cần agent đa năng để đặt bàn ăn tối, nhưng họ sẽ sớm cần các agent có thể xử lý các tác vụ nhiều bước trong lĩnh vực cụ thể, như định dạng dữ liệu tuân thủ, điều phối quy trình khách hàng hoặc tạo nội dung đa định dạng.
📌 Genspark đã tạo bước đột phá với Super Agent - hệ thống AI đa năng có khả năng thực hiện nhiều tác vụ phức tạp với điểm số 87,8% trên tiêu chuẩn GAIA. Với kiến trúc dựa trên 9 mô hình LLM, 80+ công cụ và 10+ bộ dữ liệu độc quyền, Super Agent đánh dấu sự khởi đầu của kỷ nguyên agent AI tổng quát.
https://venturebeat.com/ai/gensparks-super-agent-ups-the-ante-in-the-general-ai-agent-race/