- OpenAI đang thử nghiệm một mô hình AI đa phương thức mới với một số khách hàng, dự kiến sẽ được giới thiệu vào thứ Hai tới.
- Mô hình mới này có khả năng diễn giải hình ảnh và âm thanh nhanh hơn, chính xác hơn so với các mô hình chuyển văn bản thành giọng nói và chép lời hiện có của OpenAI.
- Công nghệ tiên tiến này có thể giúp nhân viên chăm sóc khách hàng hiểu rõ hơn ngữ điệu và sự mỉa mai của người gọi.
- Mô hình cũng có tiềm năng hỗ trợ học sinh giải toán hoặc dịch các biển hiệu ngoài đời thực.
- Mô hình mới vượt trội hơn GPT-4 Turbo trong việc trả lời một số loại câu hỏi cụ thể, tuy nhiên vẫn có thể đưa ra giả định sai lầm một cách tự tin.
- Nhà phát triển Ananay Arora phát hiện khả năng OpenAI giới thiệu tính năng mới của ChatGPT cho phép thực hiện cuộc gọi điện thoại.
- Arora tìm thấy mã liên quan đến cuộc gọi và bằng chứng về các máy chủ được cung cấp để giao tiếp âm thanh và video thời gian thực.
- Đây không phải là GPT-5 và OpenAI cũng không ra mắt công cụ tìm kiếm mới dựa trên AI.
- Google cũng đang thử nghiệm các cuộc gọi điện thoại được hỗ trợ bởi AI và được cho là đang phát triển "Pixie", sản phẩm thay thế Google Assistant đa phương thức.
📌 OpenAI đang chuẩn bị ra mắt một trợ lý ảo đa phương thức mới với khả năng gọi điện, diễn giải hình ảnh và âm thanh chính xác hơn. Công nghệ này hứa hẹn cải thiện đáng kể dịch vụ khách hàng và hỗ trợ giáo dục, tuy nhiên vẫn còn một số hạn chế cần khắc phục.
Citations:
[1] https://www.theverge.com/2024/5/11/24154307/openai-multimodal-digital-assistant-chatgpt-phone-calls