- Google ra mắt Imagen 2, một họ các mô hình AI có thể tạo và chỉnh sửa ảnh từ lệnh văn bản, tích hợp trong nền tảng Vertex AI.
- Imagen 2 hiện đã hỗ trợ tạo video clip ngắn 4 giây từ lệnh văn bản, tính năng được gọi là "text-to-live images", nhắm đến đối tượng marketer và người sáng tạo nội dung.
- Tuy nhiên, độ phân giải video tạo ra còn thấp (360x640 pixel). Google hứa sẽ cải thiện điều này trong tương lai.
- Để giải quyết lo ngại về deepfake, Google sẽ áp dụng watermark ẩn SynthID lên video, nhưng công cụ phát hiện watermark này chỉ Google nắm giữ.
- So với các công cụ tạo video AI khác như Runway, Stable Video Diffusion hay Sora của OpenAI, Imagen 2 vẫn thua kém về độ phân giải, độ dài video và tính tùy biến.
- Google sở hữu các công nghệ tạo video ấn tượng hơn như Imagen Video và Phenaki, nhưng dường như chưa tận dụng hết tiềm năng.
- Thông tin về dữ liệu huấn luyện Imagen 2 khá mơ hồ, chủ yếu lấy từ web công khai. Chưa có cơ chế cho tác giả loại trừ tác phẩm khỏi quá trình huấn luyện hay đền bù bản quyền.
- Tính năng text-to-live images chưa nằm trong chính sách bảo vệ bản quyền của Google dành cho khách hàng, do còn trong giai đoạn preview.
📌 Imagen 2 của Google tích hợp khả năng tạo video clip 4 giây từ lệnh văn bản, nhưng vẫn thua kém đối thủ về chất lượng, tính năng. Thông tin dữ liệu huấn luyện và chính sách bản quyền chưa rõ ràng. Google dường như chưa phát huy hết năng lực công nghệ tạo video AI mình sở hữu. Để giải quyết lo ngại về deepfake, Google sẽ áp dụng watermark ẩn SynthID lên video, nhưng công cụ phát hiện watermark này chỉ Google nắm giữ.
https://techcrunch.com/2024/04/09/google-releases-imagen-2-a-video-clip-generator/