- OpenAI dường như đã cải tiến công cụ tạo ảnh DALL-E 3, đặc biệt về khả năng tạo văn bản. DALL-E 3 giờ đây tạo ra các đoạn văn bản dài chính xác hơn.
- Mặc dù OpenAI giới thiệu mô hình đa phương thức GPT-4o với khả năng tạo ảnh nâng cao, công ty vẫn tiếp tục cải tiến DALL-E 3.
- So sánh DALL-E 3 với Midjourney, Ideogram và các ví dụ từ GPT-4o cho thấy GPT-4o dường như vượt trội hơn hẳn về khả năng hiểu prompt và tạo văn bản, bất chấp những cải tiến của DALL-E 3 và các công cụ tạo ảnh khác.
- Với một bài thơ viết tay trong nhật ký, DALL-E 3 làm tốt hơn Midjourney và Ideogram trong việc minh họa, nhưng vẫn chỉ tái tạo một phần văn bản mong muốn một cách chính xác. GPT-4o rõ ràng dẫn đầu ở đây.
- Với góc nhìn thứ nhất của robot nhắn tin, DALL-E 3 chính xác nhất trong việc thực hiện góc nhìn yêu cầu và văn bản có thể đọc được một phần, nhưng vẫn còn cách xa mức độ của GPT-4o.
- Với việc xếp chồng các khối lập phương có màu sắc và chữ cái khác nhau, Midjourney và Ideogram hoàn thành tốt nhiệm vụ, trong khi DALL-E 3 thậm chí không hình dung đúng số lượng khối.
- Sẽ rất thú vị để xem liệu OpenAI có tiếp tục phát triển DALL-E hay không. Về chất lượng, GPT-4o hoàn toàn có thể thay thế mô hình tạo ảnh chuyên biệt này.
- Xu hướng các mô hình đa phương thức lớn vượt trội hơn các mô hình chuyên biệt trong từng lĩnh vực (âm thanh, video, hình ảnh) có thể mang lại lợi thế cho các công ty lớn như Google, Microsoft và OpenAI - những đơn vị có đủ nguồn lực để phát triển và triển khai các mô hình đa phương thức lớn nhất.
📌 OpenAI đã cải tiến đáng kể DALL-E 3, đặc biệt về khả năng tạo văn bản. Tuy nhiên, khi so sánh với Midjourney, Ideogram và GPT-4o, mô hình đa phương thức mới của OpenAI vẫn cho thấy sự vượt trội vượt bậc trong việc hiểu prompt và tạo ảnh chính xác. Điều này cho thấy xu hướng các mô hình đa phương thức lớn có thể thay thế các mô hình chuyên biệt, mang lại lợi thế cho các công ty công nghệ khổng lồ.
https://the-decoder.com/openai-upgrades-dall-e-3-instead-of-rolling-out-gpt-4os-much-better-imaging-capabilities/