• Gemini 2.0 Flash là phiên bản đầu tiên trong dòng mô hình Gemini 2.0, với hiệu suất cao hơn Gemini 1.5 Pro gấp 2 lần về tốc độ.
• Mô hình mới có khả năng đa phương thức nâng cao:
Nhận dạng và xử lý đầu vào: văn bản, hình ảnh, video, âm thanh
Tạo đầu ra tự nhiên: hình ảnh kết hợp văn bản, âm thanh đa ngôn ngữ
Tích hợp công cụ: Google Search, thực thi mã, các hàm do người dùng định nghĩa
• Project Astra - nguyên mẫu trợ lý AI toàn năng:
Đối thoại đa ngôn ngữ với khả năng hiểu giọng nói và từ ngữ phức tạp
Sử dụng được Google Search, Lens và Maps
Bộ nhớ phiên làm việc 10 phút và nhớ các cuộc hội thoại trước đó
Độ trễ thấp ngang với giao tiếp người
• Project Mariner - nguyên mẫu AI tương tác trên trình duyệt:
Hiểu và xử lý thông tin trên màn hình bao gồm pixel, văn bản, mã, hình ảnh
Đạt 83,5% hiệu suất trong benchmark WebVoyager
Tính năng an toàn: chỉ thao tác trên tab đang mở, yêu cầu xác nhận cho hành động nhạy cảm
• Jules - tác nhân AI hỗ trợ lập trình:
Tích hợp trực tiếp vào quy trình GitHub
Phân tích vấn đề, lập kế hoạch và thực thi dưới sự giám sát của lập trình viên
• Các tính năng an toàn:
Đánh giá rủi ro bởi Ủy ban Trách nhiệm và An toàn
Tự động tạo dữ liệu đánh giá và huấn luyện để giảm thiểu rủi ro
Kiểm soát quyền riêng tư và xóa phiên làm việc
Bảo vệ khỏi tấn công prompt injection
📌 Gemini 2.0 mở ra kỷ nguyên AI tác nhân với khả năng đa phương thức nâng cao, tốc độ xử lý gấp đôi Gemini 1.5 Pro, tích hợp công cụ tự nhiên và các tính năng bảo mật toàn diện. Mô hình đã được triển khai cho nhà phát triển và người dùng Gemini từ tháng 12/2024.
https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#agents-for-developers