• Google đang phát triển dự án mật có tên "Project Jarvis" - một hệ thống AI Agent có khả năng điều khiển trình duyệt web để thực hiện các tác vụ thay người dùng
• Theo The Information, dự án này dự kiến sẽ được giới thiệu vào tháng 12/2024, dựa trên thông tin từ 3 nguồn tin nội bộ
• Project Jarvis được xây dựng dựa trên phiên bản nâng cấp của mô hình AI Gemini, được tối ưu hóa đặc biệt cho trình duyệt Chrome
• Hệ thống có khả năng:
- Thu thập thông tin nghiên cứu
- Thực hiện mua sắm trực tuyến
- Đặt vé máy bay
- Tự động hóa các tác vụ web hàng ngày
• Cơ chế hoạt động của Jarvis:
- Chụp và phân tích ảnh màn hình
- Tự động nhấp chuột vào các nút
- Nhập văn bản theo yêu cầu
- Mỗi hành động mất vài giây để xử lý
• Các đối thủ cạnh tranh cũng đang phát triển công nghệ tương tự:
- Microsoft với Copilot Vision
- Apple Intelligence
- Anthropic với Claude
- OpenAI đang nghiên cứu phiên bản riêng
• Google dự kiến sẽ thử nghiệm Jarvis với một số lượng nhỏ người dùng để phát hiện và khắc phục lỗi
📌 Google chuẩn bị tham gia cuộc đua AI Agent với Project Jarvis, dự kiến ra mắt tháng 12/2024. Hệ thống có thể tự động thực hiện các tác vụ web phức tạp như đặt vé máy bay, mua sắm thông qua việc điều khiển trình duyệt Chrome, mỗi thao tác mất vài giây xử lý.
https://www.theverge.com/2024/10/26/24280431/google-project-jarvis-ai-system-computer-using-agent