- Vidu, mô hình AI tạo video của Trung Quốc, được phát triển bởi Đại học Thanh Hoa và công ty AI ShengShu Technology, đã được giới thiệu tại Diễn đàn Zhongguancun ở Bắc Kinh vào ngày 27 tháng 4 năm 2024.
- Mô hình này sử dụng công nghệ Diffusion và Transformer tiên tiến, cho phép tạo ra video có độ phân giải cao trong 16 giây, với khả năng tái hiện chi tiết phức tạp như ánh sáng, bóng tối và biểu cảm khuôn mặt một cách chân thực.
- Vidu được thiết kế để hiểu sâu sắc các yếu tố văn hóa Trung Quốc, có khả năng tích hợp các biểu tượng văn hóa đặc trưng như gấu trúc và rồng thần thoại (loong), làm tăng sự kết nối với khán giả và người sáng tạo nội dung địa phương.
- Zhu Jun, phó viện trưởng Viện Trí tuệ Nhân tạo tại Đại học Thanh Hoa và là nhà khoa học trưởng của ShengShu-AI, nhấn mạnh sự phù hợp của lộ trình kỹ thuật của Vidu với việc ra mắt Sora, thúc đẩy tiến bộ trong nghiên cứu.
- Công nghệ cốt lõi của Vidu, U-ViT, đã được đề xuất trước khi kiến trúc mô hình DiT (Diversity in Transformation) của Sora được công bố, cho thấy sự tiên phong của Trung Quốc trong lĩnh vực AI.
- Vidu không chỉ là một bước tiến về mặt công nghệ mà còn là một thành tựu chiến lược, thể hiện cam kết của Trung Quốc trong việc dẫn đầu sự phát triển AI, đồng thời cân bằng lợi ích quốc gia và bản sắc văn hóa.
📌 Vidu, mô hình AI tạo video của Trung Quốc, sử dụng công nghệ Diffusion và Transformer, có khả năng tạo ra video chất lượng cao và hiểu biết sâu sắc về văn hóa Trung Quốc. Được giới thiệu tại Diễn đàn Zhongguancun, Vidu thể hiện sự tiên phong trong công nghệ và cam kết của Trung Quốc trong việc phát triển AI.
Citations:
[1] https://www.aitoolsclub.com/meet-vidu-a-chinese-ai-video-generator-and-the-first-real-challenger-to-sora-by-openai/