• Google Cloud công bố mở rộng truy cập công khai cho hai phiên bản mô hình AI hàng đầu: Gemini 1.5 Flash và Gemini 1.5 Pro.
• Gemini 1.5 Flash là mô hình đa phương thức nhỏ với cửa sổ ngữ cảnh 1 triệu token, phù hợp cho các tác vụ tần suất cao và hẹp.
• Gemini 1.5 Pro là phiên bản mạnh mẽ nhất của mô hình ngôn ngữ lớn của Google, có cửa sổ ngữ cảnh 2 triệu token - lớn nhất trong các mô hình AI nổi tiếng hiện nay.
• Thomas Kurian, CEO Google Cloud, cho biết công ty đang thấy "động lực đáng kinh ngạc" với nỗ lực AI tạo sinh, với nhiều tổ chức lớn như Accenture, Airbus, Anthropic, Box, Broadcom, Ford, Goldman Sachs, Samsung đang xây dựng trên nền tảng của họ.
• Gemini 1.5 Flash được cho là nhanh hơn 40% so với GPT-3.5 Turbo của OpenAI khi xử lý đầu vào 10.000 ký tự, với giá đầu vào thấp hơn 4 lần.
• Gemini 1.5 Pro có thể xử lý và cân nhắc lượng văn bản lớn hơn bao giờ hết trước khi tạo ra phản hồi, bao gồm 2 giờ video độ phân giải cao, gần cả ngày âm thanh, hơn 60.000 dòng mã và hơn 1,5 triệu từ.
• Google giới thiệu tính năng bộ nhớ đệm ngữ cảnh cho cả Gemini 1.5 Pro và Flash, giúp giảm chi phí đầu vào lên đến 75%.
• Tính năng thông lượng được cung cấp cho phép nhà phát triển dự trữ dung lượng suy luận, đảm bảo khả năng mở rộng và độ tin cậy cho khối lượng công việc sản xuất.
• Các tính năng mới nhằm cải thiện trải nghiệm nhà phát triển và giúp doanh nghiệp tạo ra các tác nhân và giải pháp AI "hấp dẫn".
• Google cam kết tiếp tục giới thiệu các khả năng mới cho cả mô hình và nền tảng Vertex với tốc độ nhanh chóng.
• Việc phát hành các biến thể Gemini nhằm thể hiện cách công việc AI của Google trao quyền cho doanh nghiệp phát triển các tác nhân và giải pháp AI "hấp dẫn".
📌 Google mở rộng truy cập Gemini 1.5 Flash và Pro với cửa sổ ngữ cảnh 2 triệu token, nhanh hơn 40% so với GPT-3.5 Turbo. Tính năng bộ nhớ đệm ngữ cảnh giảm chi phí 75%, thông lượng được cung cấp tăng độ tin cậy cho nhà phát triển.
https://venturebeat.com/ai/google-opens-up-gemini-1-5-flash-pro-with-2m-tokens-to-the-public/