• World Labs của Fei-Fei Li đã huy động được 230 triệu USD để phát triển "mô hình thế giới lớn", trong khi DeepMind tuyển dụng một trong những người sáng tạo Sora của OpenAI
• Mô hình thế giới lấy cảm hứng từ cách não người xử lý thông tin và hình thành hiểu biết về thế giới xung quanh
• Ví dụ điển hình là cách vận động viên bóng chày dự đoán đường đi của bóng trong vài mili giây, dựa trên mô hình tiềm thức trong não
• Mô hình thế giới được huấn luyện bằng nhiều loại dữ liệu như hình ảnh, âm thanh, video và văn bản để tạo ra hiểu biết về cách thế giới vận hành
• Ứng dụng quan trọng nhất hiện nay là trong lĩnh vực tạo video AI, giúp tạo ra các video chân thực hơn với chuyển động tự nhiên của các vật thể
• Yann LeCun, nhà khoa học trưởng AI của Meta, cho rằng mô hình này có thể được sử dụng cho việc dự báo và lập kế hoạch phức tạp
• Sora của OpenAI được coi là một mô hình thế giới sơ khai, có khả năng mô phỏng các hành động như vẽ tranh và render thế giới game Minecraft
• Thách thức lớn nhất bao gồm:
- Yêu cầu sức mạnh tính toán khổng lồ
- Vấn đề ảo giác và định kiến trong dữ liệu huấn luyện
- Thiếu dữ liệu huấn luyện đa dạng
- Khó khăn trong việc tạo ra bản đồ môi trường nhất quán
• Tiềm năng trong tương lai bao gồm tạo thế giới ảo 3D tương tác, cải thiện khả năng robot và hỗ trợ ra quyết định AI
📌 Mô hình thế giới AI đang được đầu tư mạnh mẽ với 230 triệu USD từ World Labs. Công nghệ này hứa hẹn cách mạng hóa khả năng AI trong việc hiểu và tương tác với thế giới thực, đặc biệt trong lĩnh vực tạo video AI và robotics, nhưng vẫn đối mặt với những thách thức lớn về công nghệ và dữ liệu.
https://techcrunch.com/2024/10/28/what-are-ai-world-models-and-why-do-they-matter/