OpenAI giảm sốc 80% chi phí dịch vụ API RealTime - Cơ hội vàng cho nhà phát triển chatbot

- OpenAI vừa công bố tại sự kiện dành cho nhà phát triển ở London về việc bổ sung tính năng tự động cache âm thanh và văn bản đầu vào cho API RealTime

- API RealTime được thiết kế để tạo ứng dụng và phần mềm có tích hợp trợ lý giọng nói và agent AI, hiện đang được sử dụng bởi các công ty như Healthify, Speak và Twilio

- Mức giá xử lý token hiện tại:
  + Văn bản đầu vào: 5 USD/1 triệu token
  + Văn bản đầu ra: 20 USD/1 triệu token
  + Âm thanh đầu vào: 100 USD/1 triệu token
  + Âm thanh đầu ra: 200 USD/1 triệu token

- Vấn đề chính được Kwindla Kramer, đồng sáng lập công ty Daily chỉ ra: API sẽ gửi lại tất cả token đầu vào và đầu ra trước đó sau mỗi lần nhập mới, khiến chi phí cuộc hội thoại tăng theo cấp số nhân

- Mức giá mới sau khi áp dụng cache:
  + Văn bản: giảm từ 5 USD xuống 2,5 USD/1 triệu token
  + Âm thanh: giảm 80% từ 100 USD xuống 20 USD/1 triệu token đầu vào

- Shaun Ralston từ đội hỗ trợ API OpenAI giải thích: khi người dùng gửi nội dung tương tự hoặc giống với văn bản/âm thanh đã xử lý trước đó, OpenAI có thể truy xuất kết quả thay vì xử lý lại

📌 OpenAI đã thực hiện bước đột phá trong việc tối ưu chi phí API RealTime thông qua công nghệ cache, giảm đến 80% chi phí xử lý âm thanh xuống còn 20 USD/triệu token và 50% chi phí xử lý văn bản xuống 2,5 USD/triệu token.

https://www.inc.com/ben-sherry/openai-just-made-an-important-service-80-percent-cheaper/90996929

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo