• Apple đã phát triển mô hình AI mới có tên Depth Pro, có khả năng tạo bản đồ độ sâu 3D chi tiết từ hình ảnh 2D đơn lẻ chỉ trong 0,3 giây.
• Depth Pro không cần dữ liệu camera truyền thống để đưa ra dự đoán, mở ra tiềm năng ứng dụng rộng rãi trong nhiều lĩnh vực như thực tế tăng cường và xe tự lái.
• Mô hình này sử dụng kiến trúc transformer đa quy mô hiệu quả để xử lý đồng thời cả ngữ cảnh tổng thể và chi tiết của hình ảnh.
• Depth Pro có khả năng ước tính cả độ sâu tương đối và tuyệt đối (độ sâu metric), cung cấp các phép đo trong thế giới thực.
• Mô hình có khả năng học zero-shot, cho phép áp dụng cho nhiều loại hình ảnh khác nhau mà không cần đào tạo lại trên bộ dữ liệu cụ thể.
• Depth Pro vượt trội so với các mô hình khác trong việc xử lý các thách thức như "flying pixels" và truy vết biên chính xác.
• Apple đã công bố mã nguồn mở của Depth Pro trên GitHub, bao gồm kiến trúc mô hình và trọng số đã được đào tạo trước.
• Mô hình này có thể tạo bản đồ độ sâu có độ phân giải 2,25 megapixel với độ sắc nét đặc biệt, nắm bắt được cả những chi tiết nhỏ như tóc và thực vật.
• Depth Pro đạt hiệu suất cao nhất trong so sánh với các mô hình khác trên nhiều bộ dữ liệu, với xếp hạng trung bình là 2,5.
• Ứng dụng tiềm năng của Depth Pro bao gồm cải thiện trải nghiệm thực tế tăng cường, nâng cao khả năng phát hiện và điều hướng chướng ngại vật của xe tự lái.
• Trong thương mại điện tử, Depth Pro có thể cho phép người tiêu dùng xem cách đồ nội thất phù hợp với ngôi nhà của họ chỉ bằng cách chĩa camera điện thoại vào phòng.
• Mô hình này có thể đẩy nhanh quá trình phát triển sản phẩm và ra quyết định dựa trên AI trong nhiều ngành công nghiệp.
📌 Apple đã tạo ra bước đột phá trong lĩnh vực nhận thức 3D với Depth Pro, mô hình AI có khả năng tạo bản đồ độ sâu 3D chi tiết từ hình ảnh 2D trong 0,3 giây. Với tính năng học zero-shot và khả năng ước tính độ sâu metric, Depth Pro mở ra tiềm năng ứng dụng rộng rãi từ thực tế tăng cường đến xe tự lái.
https://venturebeat.com/ai/apple-releases-depth-pro-an-ai-model-that-rewrites-the-rules-of-3d-vision/