OpenAI ra mắt mô hình AI tạo sinh đa phương tiện GPT-4o, nâng cấp khả năng xử lý văn bản, giọng nói và hình ảnh

- OpenAI giới thiệu mô hình AI tạo sinh mới GPT-4o, có khả năng xử lý văn bản, giọng nói và hình ảnh.
- GPT-4o nâng cấp trải nghiệm trên ChatGPT, cho phép người dùng tương tác tự nhiên hơn như với một trợ lý ảo.
- Mô hình mới có thể phân tích hình ảnh, trả lời các câu hỏi liên quan và thậm chí nhận biết được các sắc thái trong giọng nói của người dùng.
- GPT-4o hỗ trợ khoảng 50 ngôn ngữ với hiệu suất cải thiện đáng kể.
- Trong API của OpenAI, GPT-4o nhanh gấp đôi, giá bằng một nửa và có giới hạn tốc độ cao hơn so với GPT-4 Turbo.
- OpenAI sẽ giới thiệu khả năng xử lý âm thanh của GPT-4o cho một nhóm đối tác tin cậy trong vài tuần tới.
- GPT-4o đã có mặt trong phiên bản miễn phí của ChatGPT từ hôm nay, và dành cho người đăng ký gói ChatGPT Plus và Team với giới hạn tin nhắn cao gấp 5 lần.
- OpenAI cũng ra mắt giao diện ChatGPT mới trên web và ứng dụng ChatGPT trên macOS, cho phép người dùng đặt câu hỏi qua phím tắt hoặc chụp và thảo luận về ảnh chụp màn hình.
- GPT Store, thư viện và công cụ tạo chatbot của bên thứ ba được xây dựng trên các mô hình AI của OpenAI, hiện đã có sẵn cho người dùng gói miễn phí của ChatGPT.
- Người dùng miễn phí giờ đây có thể sử dụng các tính năng trước đây chỉ dành cho người dùng trả phí, như khả năng ghi nhớ tùy chọn cho các tương tác trong tương lai, tải lên tệp và ảnh, cũng như tìm kiếm web để trả lời các câu hỏi kịp thời.

📌 GPT-4o đánh dấu bước tiến quan trọng của OpenAI trong việc tạo ra các mô hình AI tạo sinh đa phương tiện, nâng cao trải nghiệm tương tác giữa người và máy. Với khả năng xử lý văn bản, giọng nói và hình ảnh, GPT-4o hứa hẹn sẽ mang đến một trợ lý ảo thông minh và dễ sử dụng hơn trên ChatGPT, đồng thời mở ra nhiều tiềm năng ứng dụng mới trong tương lai.

https://techcrunch.com/2024/05/13/openais-newest-model-is-gpt-4o/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo