Google ra mắt Gemini 2.0 - mô hình AI tiên tiến nhất

• Gemini 2.0 Flash là phiên bản đầu tiên trong dòng mô hình Gemini 2.0, với hiệu suất cao hơn Gemini 1.5 Pro gấp 2 lần về tốc độ.

• Mô hình mới có khả năng đa phương thức nâng cao:

Nhận dạng và xử lý đầu vào: văn bản, hình ảnh, video, âm thanh

Tạo đầu ra tự nhiên: hình ảnh kết hợp văn bản, âm thanh đa ngôn ngữ

Tích hợp công cụ: Google Search, thực thi mã, các hàm do người dùng định nghĩa

• Project Astra - nguyên mẫu trợ lý AI toàn năng:

Đối thoại đa ngôn ngữ với khả năng hiểu giọng nói và từ ngữ phức tạp

Sử dụng được Google Search, Lens và Maps

Bộ nhớ phiên làm việc 10 phút và nhớ các cuộc hội thoại trước đó

Độ trễ thấp ngang với giao tiếp người

• Project Mariner - nguyên mẫu AI tương tác trên trình duyệt:

Hiểu và xử lý thông tin trên màn hình bao gồm pixel, văn bản, mã, hình ảnh

Đạt 83,5% hiệu suất trong benchmark WebVoyager

Tính năng an toàn: chỉ thao tác trên tab đang mở, yêu cầu xác nhận cho hành động nhạy cảm

• Jules - tác nhân AI hỗ trợ lập trình:

Tích hợp trực tiếp vào quy trình GitHub

Phân tích vấn đề, lập kế hoạch và thực thi dưới sự giám sát của lập trình viên

• Các tính năng an toàn:

Đánh giá rủi ro bởi Ủy ban Trách nhiệm và An toàn

Tự động tạo dữ liệu đánh giá và huấn luyện để giảm thiểu rủi ro

Kiểm soát quyền riêng tư và xóa phiên làm việc

Bảo vệ khỏi tấn công prompt injection

📌 Gemini 2.0 mở ra kỷ nguyên AI tác nhân với khả năng đa phương thức nâng cao, tốc độ xử lý gấp đôi Gemini 1.5 Pro, tích hợp công cụ tự nhiên và các tính năng bảo mật toàn diện. Mô hình đã được triển khai cho nhà phát triển và người dùng Gemini từ tháng 12/2024.

https://blog.google/technology/google-deepmind/google-gemini-ai-update-december-2024/#agents-for-developers

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo