OpenAI ra mắt Sora: Từ văn bản thành video 1080p

• Sora là mô hình tạo video AI của OpenAI, có thể tạo video độ phân giải 1080p (tối đa 20 giây) từ văn bản, hình ảnh hoặc video đầu vào.

• Mô hình sử dụng kỹ thuật khuếch tán, bắt đầu từ video nhiễu và dần dần loại bỏ nhiễu qua nhiều bước. Sora kế thừa kiến trúc transformer từ các mô hình GPT và kỹ thuật recaptioning từ DALL·E 3.

• OpenAI đã làm việc với hơn 300 nghệ sĩ từ 60+ quốc gia để thu thập phản hồi về mô hình. Đồng thời tiến hành thử nghiệm red-teaming với các chuyên gia từ 9 quốc gia, kiểm tra hơn 15.000 lượt tạo video.

• Hệ thống an toàn của Sora bao gồm nhiều lớp:

Bộ lọc đa phương tiện kiểm duyệt văn bản và hình ảnh

Mô hình LLM tùy chỉnh để phát hiện nội dung vi phạm

Bộ phân loại đầu ra cho nội dung nhạy cảm

Danh sách chặn từ khóa

• Sora tập trung vào các lĩnh vực rủi ro chính:

Bảo vệ trẻ em với độ chính xác 97,86% trong phát hiện hình ảnh trẻ em thực

Kiểm soát nội dung khiêu dâm với độ chính xác 97,59%

Phát hiện nội dung lừa đảo về bầu cử đạt độ chính xác 98,23%

• Tất cả video được tạo ra đều được gắn thủy vân và metadata C2PA để đảm bảo nguồn gốc. OpenAI cũng phát triển công cụ tìm kiếm ngược để xác định video do Sora tạo ra.

📌 Sora là bước đột phá mới của OpenAI trong lĩnh vực AI tạo sinh video với độ phân giải cao 1080p, tích hợp nhiều lớp bảo mật và kiểm soát nội dung, đạt độ chính xác trên 97% trong việc phát hiện nội dung nhạy cảm.

https://openai.com/index/sora-system-card/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo