Google DeepMind ra mắt Veo 2 - Mô hình AI tạo video vượt trội Sora với độ phân giải 4k và thời lượng gấp 6 lần

• Google DeepMind vừa công bố Veo 2, thế hệ tiếp theo của mô hình tạo video AI, với khả năng tạo video độ phân giải lên đến 4k (4096 x 2160 pixel) và thời lượng hơn 2 phút[1].

• So với Sora của OpenAI, Veo 2 có độ phân giải cao gấp 4 lần và thời lượng dài hơn 6 lần. Tuy nhiên trong công cụ thử nghiệm VideoFX, video được giới hạn ở độ phân giải 720p và dài 8 giây[1].

• Veo 2 có những cải tiến đáng kể:
- Hiểu biết tốt hơn về vật lý và điều khiển camera
- Tạo ra video rõ nét hơn, đặc biệt trong cảnh có nhiều chuyển động
- Mô phỏng chân thực hơn về chuyển động, động lực học chất lỏng và tính chất ánh sáng
- Khả năng tạo biểu cảm con người tinh tế hơn[1].

• Mô hình vẫn còn một số hạn chế như:
- Khó duy trì nhất quán trong các yêu cầu phức tạp
- Tính nhất quán của nhân vật chưa hoàn hảo
- Cần cải thiện chi tiết phức tạp và chuyển động nhanh[1].

• Google DeepMind tích hợp công nghệ thủy vân SynthID để nhúng các dấu hiệu không nhìn thấy vào các khung hình do Veo 2 tạo ra, nhằm giảm thiểu nguy cơ deepfake[1].

• Công ty cũng công bố nâng cấp cho Imagen 3 - mô hình tạo ảnh thương mại, với khả năng tạo ảnh sáng hơn, bố cục tốt hơn trong nhiều phong cách như ảnh thực tế, ấn tượng và anime[1].

📌 Google DeepMind đã tạo bước đột phá với Veo 2, vượt trội so với Sora của OpenAI về độ phân giải (4k) và thời lượng (>2 phút). Mô hình tích hợp công nghệ thủy vân SynthID, cải thiện đáng kể về vật lý và điều khiển camera, nhưng vẫn cần hoàn thiện về tính nhất quán và chi tiết phức tạp.

Citations:
[1] https://techcrunch.com/2024/12/16/google-deepmind-unveils-a-new-video-model-to-rival-sora/

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo