OpenAI ra mắt mô hình SCM tăng tốc tạo media lên 50 lần

 

  • OpenAI đã phát triển mô hình nhất quán liên tục (sCM), tăng tốc độ tạo nội dung AI như hình ảnh, video và âm thanh nhanh gấp 50 lần so với các mô hình khuếch tán truyền thống.
  • Với sCM, nội dung có thể được tạo ra chỉ trong 0,11 giây trên một GPU A100, so với hơn 5 giây với các mô hình khuếch tán hiện tại.
  • Công nghệ mới này sử dụng hai bước sampling thay vì hàng trăm bước như trước đây, giảm thiểu chi phí tính toán mà vẫn giữ chất lượng cao với điểm FID là 1,88 trên tập dữ liệu ImageNet 512×512.
  • Mô hình này vượt trội nhờ khả năng mở rộng tỉ lệ với mô hình khuếch tán “giáo viên”, giúp rút ngắn khoảng cách về chất lượng khi tăng kích thước và số lượng tham số.
  • Các bài kiểm tra hiệu năng cho thấy sCM mang lại kết quả vượt trội với ít tài nguyên tính toán hơn, làm cho AI tạo sinh thời gian thực trở nên khả thi hơn.
  • Mô hình sCM mở ra cơ hội ứng dụng rộng rãi trong các lĩnh vực đòi hỏi tốc độ và chất lượng cao như tạo hình ảnh, video và âm thanh thời gian thực.
  • Sự thành công của sCM có thể là bước đệm cho DALL-E 4, giúp OpenAI tiến gần hơn đến các ứng dụng AI thời gian thực cho nhiều ngành công nghiệp.
  • Nghiên cứu của OpenAI nhấn mạnh tiềm năng tối ưu hóa hiệu năng hơn nữa, phù hợp với các nhu cầu cụ thể trong các lĩnh vực khác nhau.

📌 Mô hình sCM của OpenAI cải thiện tốc độ tạo media lên 50 lần, mở ra tiềm năng ứng dụng AI thời gian thực. Công nghệ này có thể cách mạng hóa nhiều ngành công nghiệp với khả năng tạo nội dung nhanh chóng và hiệu quả.

https://venturebeat.com/ai/openai-researchers-develop-new-model-that-speeds-up-media-generation-by-50x/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo