Google ra mắt Gemini 2.5 Flash với “ngân sách suy nghĩ” cho phép developer kiểm soát mức độ suy luận của AI

  • Google chính thức phát hành Gemini 2.5 Flash bản preview, tích hợp tính năng mới “ngân sách suy nghĩ” (thinking budget) cho developer điều chỉnh độ sâu suy luận của AI theo từng prompt và mục tiêu sử dụng.

  • Toàn bộ dòng Gemini 2.5 đều có năng lực suy luận, cho phép AI “suy nghĩ trước khi trả lời” giúp tăng hiệu suất, độ chính xác, đặc biệt với các tác vụ suy luận đa bước như toán học, nghiên cứu.

  • Với 2.5 Flash, developer có thể kiểm soát số token AI sử dụng khi “suy nghĩ”, từ 0 tới 24.576 token, điều chỉnh qua slider trên Google AI Studio, Vertex AI hoặc thông số API; càng tăng ngân sách suy nghĩ, chất lượng suy luận càng cao.

  • Nếu đặt ngân sách về 0, chi phí và độ trễ sẽ tương đương với Gemini 2.0 Flash, giúp tối ưu chi phí cho những tác vụ đơn giản.

  • Nếu không chỉ định ngân sách, AI sẽ tự động quyết định mức độ suy nghĩ dựa trên độ phức tạp của prompt, ví dụ: dịch đơn giản hoặc hỏi kiến thức trực tiếp cần ít suy luận, bài toán xác suất hay lên lịch cá nhân phức tạp sẽ cần nhiều hơn.

  • Thông số chính Gemini 2.5 Flash:

    • Giới hạn tốc độ: 1.000 RPM / 10.000 RPD (trả phí), 10 RPM / 500 RPD (miễn phí)

    • Ngày cắt đứt kiến thức: 01.2025

    • Đầu vào: văn bản, hình ảnh, video, âm thanh; đầu ra: văn bản

    • Cửa sổ ngữ cảnh: 1.000.000 token, độ dài kết quả tối đa: 64.000 token

  • Gemini 2.5 Flash đã mở preview cho developer trên Google AI Studio và Vertex AI, sắp cập nhật hoàn thiện trước khi phát hành rộng rãi.

  • Gemini app cũng tích hợp 2.5 Flash (experimental), tự động điều chỉnh mức suy luận theo độ phức tạp prompt nhưng không cho người dùng tuỳ chỉnh thủ công. Ứng dụng vẫn hỗ trợ các tính năng như upload file, Extension, và sẽ thay thế 2.0 Flash Thinking bản cũ.

📌 Gemini 2.5 Flash mở ra kỷ nguyên AI tạo sinh điều chỉnh độ suy luận linh hoạt: developer kiểm soát ngân sách suy nghĩ tới 24.576 token, tốc độ nhanh, chi phí thấp, tối ưu hoá từng tác vụ từ dịch thuật đơn giản đến phân tích phức tạp; sẵn sàng trên Google AI Studio, Vertex AI, Gemini app.

 

https://9to5google.com/2025/04/17/gemini-2-5-flash-preview-launch/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo