- Google vừa công bố Project Mariner - một tiện ích mở rộng Chrome mới được xây dựng trên nền tảng Gemini 2.0, có khả năng tự động điều hướng và thực hiện các tác vụ trên web thay người dùng
- Dự án được phát triển bởi đội ngũ Google DeepMind, ra mắt ngay sau khi Gemini 2.0 multimodal được công bố trong tuần này
- Project Mariner hoạt động trong thanh bên của trình duyệt Chrome, hiện chỉ giới hạn cho người dùng tại Mỹ đăng ký trải nghiệm sớm
- So với tính năng Computer Use của Anthropic Claude, điểm khác biệt quan trọng của Project Mariner là tích hợp khả năng lập luận trong quá trình hoạt động
- Công cụ này có thể:
+ Tự động điều hướng và nhấp vào các liên kết
+ Hiểu nội dung đang xem
+ Hoạt động đồng thời trên nhiều trang web
+ Giải thích lý do đằng sau mỗi hành động
+ Xử lý đa phương tiện bao gồm video và âm thanh
- Một video demo cho thấy Project Mariner có thể tự động tìm kiếm thông tin liên hệ của các công ty từ bảng tính và tạo danh sách tiếp cận mà không cần sự can thiệp của người dùng
- Jaclyn Konzelmann, giám đốc sản phẩm của Google cho biết đội ngũ đang làm việc với các tester tin cậy để cải thiện tốc độ và độ mượt, đồng thời nhấn mạnh tầm quan trọng của việc giữ con người trong vòng kiểm soát
📌 Project Mariner là bước tiến mới của Google trong lĩnh vực AI agent, được xây dựng trên Gemini 2.0 với khả năng tự động hóa hoàn toàn các tác vụ web phức tạp. Hiện chỉ có người dùng Mỹ được trải nghiệm sớm tính năng này thông qua tiện ích mở rộng Chrome.
https://www.tomsguide.com/ai/google-gemini/google-reveals-project-mariner-a-new-browser-agent-that-can-automate-your-digital-life
Google tiết lộ Dự án Mariner — một tác nhân trình duyệt mới có thể tự động hóa cuộc sống số của bạn
Tính năng
Bởi Nigel Powell, được đăng 8 giờ trước
Trình duyệt web của bạn sắp trở nên thông minh hơn bạn
Khi bạn mua hàng qua các liên kết trên trang web của chúng tôi, chúng tôi có thể nhận được hoa hồng liên kết. Đây là cách hoạt động.
Logo Gemini
(Ảnh minh họa: Shutterstock)
Trong tinh thần mùa lễ hội, Google đã tham gia làn sóng các thông báo AI trước cuối năm với việc ra mắt sản phẩm AI tạo sinh tác vụ web mới mang tên Dự án Mariner — được xây dựng trên nền tảng Gemini 2.0 mạnh mẽ.
Tiện ích mở rộng Chrome thử nghiệm này hoạt động ở thanh bên của trình duyệt, cho phép tự động điều hướng, tìm kiếm và thực hiện các hành động thay mặt người dùng. Người dùng quan tâm có thể đăng ký để trải nghiệm sớm trên trang web của Dự án Mariner, mặc dù quyền truy cập hiện chỉ giới hạn tại Mỹ.
Sản phẩm này được phát triển bởi nhóm AI DeepMind của Google, ra mắt sau khi mô hình đa phương thức Gemini 2.0 cũng vừa được công bố trong tuần này. Đồng thời, Google cũng cập nhật Dự án Astra của Gemini.
Thoạt nhìn, sản phẩm mới này trông khá giống với tính năng Computer Use của Anthropic Claude, đã ra mắt trước đó một thời gian. Tuy nhiên, một điểm khác biệt quan trọng giữa hai công cụ này là công cụ của Google bao gồm khả năng suy luận trong quá trình hoạt động, đưa AI tác vụ lên một tầm cao mới.
Mariner không chỉ có thể thao tác trình duyệt của người dùng bằng cách nhấp vào các liên kết và hiểu nội dung trang web mà còn có khả năng thực hiện điều này trên nhiều trang web, đồng thời hiển thị lý do đằng sau các hành động mà nó thực hiện.
Sản phẩm cũng có khả năng xử lý thao tác đa phương thức, bao gồm cả video và âm thanh nhờ vào công nghệ nền tảng.
Theo phong cách điển hình của Google, Dự án Mariner đã được phát hành cho một nhóm nhỏ người dùng thử nghiệm dưới sự kiểm soát chặt chẽ, khi công ty đánh giá các trường hợp sử dụng và xử lý các lỗi tiềm ẩn.
“Chúng tôi đang làm việc với những người thử nghiệm đáng tin cậy để làm cho nó nhanh hơn và mượt mà hơn, và điều quan trọng là giữ con người trong vòng kiểm soát,” Jaclyn Konzelmann, quản lý sản phẩm của Google, chia sẻ.
Dự án Mariner | Giải quyết các tác vụ phức tạp với tác nhân AI trong trình duyệt Chrome - YouTube
Một video trình diễn cho thấy người dùng truy cập một bảng tính chứa đầy tên các công ty và yêu cầu Mariner tìm thông tin liên hệ của từng công ty để thêm vào danh sách tiếp cận.
Tác nhân đã điều hướng thành công qua nhiều trang web, xác định tên công ty và thông tin liên hệ, và cung cấp chính xác những gì được yêu cầu mà không cần sự can thiệp của người dùng. Đây là một minh chứng rất ấn tượng về sức mạnh của mô hình Gemini 2.0 mới.
Như chúng tôi đã dự đoán hồi đầu năm nay, có vẻ như những tháng tới sẽ chứng kiến sự ra mắt của hàng loạt sản phẩm AI tác vụ từ khắp nơi trên thế giới.
Dĩ nhiên, tất cả công nghệ này vẫn đang ở giai đoạn rất sơ khai, và còn phải xem xét mức độ hữu ích của các công cụ này trong thực tế hàng ngày của doanh nghiệp và cá nhân. Trong thời gian chờ đợi, có thể tìm hiểu thêm thông tin từ trang web chính thức của dự án Google.