- Meta đã phát triển mô hình AI mới có tên là Video Joint Embedding Predictive Architecture (V-JEPA), học hỏi từ video thay vì văn bản.
- V-JEPA sử dụng kỹ thuật che giấu một phần màn hình và dự đoán những gì xảy ra, giúp nó phát triển một mô hình khái niệm về thế giới.
- Mô hình này không phải là mô hình tạo sinh mà là mô hình dự đoán, với khả năng hiểu rõ các tương tác chi tiết giữa các đối tượng sau quá trình huấn luyện sơ bộ.
- Yann LeCun, người đứng đầu nhóm nghiên cứu AI cơ bản của Meta (FAIR), nhấn mạnh mục tiêu là xây dựng trí tuệ máy tính tiên tiến có thể học hỏi giống như con người.
- Nghiên cứu về V-JEPA có thể có ảnh hưởng lớn đến Meta và toàn bộ hệ sinh thái AI, đặc biệt là trong việc giảm thời gian và công suất tính toán cần thiết cho việc huấn luyện mô hình.
- Meta cũng đang xem xét việc kết hợp âm thanh vào video trong mô hình V-JEPA, tạo thêm một chiều dữ liệu mới cho mô hình học hỏi.
- Meta công bố mô hình V-JEPA dưới giấy phép Creative Commons phi thương mại, cho phép các nhà nghiên cứu thử nghiệm và mở rộng khả năng của nó.
📌 Mô hình AI mới của Meta, V-JEPA, đánh dấu một bước tiến quan trọng trong lĩnh vực trí tuệ nhân tạo, với cách tiếp cận độc đáo trong việc học hỏi từ video thay vì văn bản. Điều này không chỉ mở ra khả năng phát triển các mô hình AI hiểu biết sâu sắc về thế giới qua video mà còn hứa hẹn giảm đáng kể chi phí và thời gian cần thiết cho việc huấn luyện các mô hình nền tảng. Bằng cách công bố mô hình dưới giấy phép Creative Commons phi thương mại, Meta khuyến khích sự thử nghiệm và đổi mới trong cộng đồng nghiên cứu, hướng tới việc mở rộng khả năng của V-JEPA và thúc đẩy tiến bộ trong lĩnh vực AI.