- OpenAI đã công bố GPT-4 Turbo với khả năng thị giác có sẵn thông qua API của họ.
- GPT-4 Turbo được giới thiệu từ tháng 11/2023, hứa hẹn cải thiện tốc độ, tăng kích thước ngữ cảnh đầu vào (lên đến 128.000 token) và giá thành hợp lý hơn.
- Các yêu cầu sử dụng khả năng nhận dạng và phân tích hình ảnh của mô hình giờ đây có thể được thực hiện thông qua định dạng văn bản JSON và gọi hàm.
- Thay đổi này giúp hợp lý hóa quy trình làm việc cho các nhà phát triển và tạo ra các ứng dụng hiệu quả hơn.
- Một số khách hàng đã sử dụng GPT-4 Turbo với thị giác như: Cognition (tạo mã tự động), Healthify (phân tích dinh dưỡng từ ảnh bữa ăn), TLDraw (chuyển bản vẽ thành website).
- Mặc dù GPT-4 Turbo thua kém trong các bài kiểm tra chuẩn so với các mô hình mới hơn như Claude 3 Opus của Anthropic hay Gemini Advanced của Google, bước đi này sẽ giúp các mô hình của OpenAI tiếp tục hấp dẫn với khách hàng doanh nghiệp và nhà phát triển.
📌 OpenAI đã mang GPT-4 Turbo với khả năng thị giác đến với nhiều khách hàng doanh nghiệp và nhà phát triển tiềm năng thông qua API. Bước tiến này mở ra nhiều khả năng mới cho AI tạo sinh, cho phép tích hợp nhận dạng và phân tích hình ảnh vào các ứng dụng, đồng thời giúp các mô hình của OpenAI vẫn hấp dẫn trong khi thế giới chờ đợi sự ra mắt của mô hình ngôn ngữ lớn tiếp theo.
https://venturebeat.com/ai/openai-makes-gpt-4-turbo-with-vision-generally-available-through-its-api/