Genmo ra mắt Mochi-1, mô hình AI video mã nguồn mở

 

  • Genmo đã giới thiệu Mochi-1, mô hình AI video mã nguồn mở, với giấy phép Apache 2.0, cho phép cộng đồng tự do chỉnh sửa và cải thiện mô hình này.
  • Mochi-1 tập trung vào chuyển động mượt mà, khắc phục hạn chế của các mô hình AI video trước đây gặp phải hiện tượng "Live Photo".
  • Với 10 tỷ tham số, Mochi-1 sử dụng phương pháp khuếch tán bất đồng bộ, giúp tối ưu hóa sức mạnh trong kích thước gọn nhẹ.
  • Mô hình này được huấn luyện độc quyền trên dữ liệu video thay vì kết hợp hình ảnh và văn bản, mang lại khả năng hiểu rõ hơn về chuyển động và vật lý.
  • Mochi-1 hiện đang ở giai đoạn xem trước nghiên cứu, với độ phân giải giới hạn 480p. Genmo nhấn mạnh rằng các tính năng mới sẽ được cải tiến dựa trên phản hồi từ người dùng.
  • Paras Jain, CEO của Genmo, khẳng định công ty đã đầu tư mạnh vào khả năng bám sát yêu cầu của người dùng thông qua prompt và sử dụng mô hình ngôn ngữ hình ảnh để đánh giá độ chính xác.
  • Cạnh tranh với Allegro từ Rhymes, một mô hình AI video mã nguồn mở khác ra mắt cùng tuần, Mochi-1 mang lại hiệu năng tốt hơn với 24 khung hình/giây so với 15 khung hình/giây của Allegro.
  • Jain kỳ vọng với bản chất mã nguồn mở, các nhà phát triển sẽ tiếp tục tối ưu hóa để Mochi-1 có thể chạy trên phần cứng yếu hơn trong tương lai, mang lại khả năng tạo video ngoại tuyến.

📌 Mochi-1 đánh dấu bước đột phá trong lĩnh vực AI video mã nguồn mở, mang lại công cụ mạnh mẽ cho cộng đồng và mở ra tiềm năng tùy chỉnh không giới hạn. Với trọng tâm vào chuyển động và độ chính xác, Mochi-1 hứa hẹn cạnh tranh mạnh mẽ trên thị trường AI video.

https://www.tomsguide.com/ai/meet-mochi-1-the-latest-free-and-open-source-ai-video-model

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo