AI ảnh-video-music-âm thanh OpenAI ChatGPT 2024-06-21 00:32:08

OpenAI nâng cấp DALL-E 3 thay vì tung ra khả năng tạo ảnh vượt trội của GPT-4o

- OpenAI dường như đã cải tiến công cụ tạo ảnh DALL-E 3, đặc biệt về khả năng tạo văn bản. DALL-E 3 giờ đây tạo ra các đoạn văn bản dài chính xác hơn.

- Mặc dù OpenAI giới thiệu mô hình đa phương thức GPT-4o với khả năng tạo ảnh nâng cao, công ty vẫn tiếp tục cải tiến DALL-E 3.

- So sánh DALL-E 3 với Midjourney, Ideogram và các ví dụ từ GPT-4o cho thấy GPT-4o dường như vượt trội hơn hẳn về khả năng hiểu prompt và tạo văn bản, bất chấp những cải tiến của DALL-E 3 và các công cụ tạo ảnh khác.

- Với một bài thơ viết tay trong nhật ký, DALL-E 3 làm tốt hơn Midjourney và Ideogram trong việc minh họa, nhưng vẫn chỉ tái tạo một phần văn bản mong muốn một cách chính xác. GPT-4o rõ ràng dẫn đầu ở đây.

- Với góc nhìn thứ nhất của robot nhắn tin, DALL-E 3 chính xác nhất trong việc thực hiện góc nhìn yêu cầu và văn bản có thể đọc được một phần, nhưng vẫn còn cách xa mức độ của GPT-4o.

- Với việc xếp chồng các khối lập phương có màu sắc và chữ cái khác nhau, Midjourney và Ideogram hoàn thành tốt nhiệm vụ, trong khi DALL-E 3 thậm chí không hình dung đúng số lượng khối.

- Sẽ rất thú vị để xem liệu OpenAI có tiếp tục phát triển DALL-E hay không. Về chất lượng, GPT-4o hoàn toàn có thể thay thế mô hình tạo ảnh chuyên biệt này.

- Xu hướng các mô hình đa phương thức lớn vượt trội hơn các mô hình chuyên biệt trong từng lĩnh vực (âm thanh, video, hình ảnh) có thể mang lại lợi thế cho các công ty lớn như Google, Microsoft và OpenAI - những đơn vị có đủ nguồn lực để phát triển và triển khai các mô hình đa phương thức lớn nhất.

📌 OpenAI đã cải tiến đáng kể DALL-E 3, đặc biệt về khả năng tạo văn bản. Tuy nhiên, khi so sánh với Midjourney, Ideogram và GPT-4o, mô hình đa phương thức mới của OpenAI vẫn cho thấy sự vượt trội vượt bậc trong việc hiểu prompt và tạo ảnh chính xác. Điều này cho thấy xu hướng các mô hình đa phương thức lớn có thể thay thế các mô hình chuyên biệt, mang lại lợi thế cho các công ty công nghệ khổng lồ.

https://the-decoder.com/openai-upgrades-dall-e-3-instead-of-rolling-out-gpt-4os-much-better-imaging-capabilities/

Không có file đính kèm.

Nguồn tham khảo

170

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng

OpenAI nâng cấp DALL-E 3 thay vì tung ra khả năng tạo ảnh vượt trội của GPT-4o

Thảo luận

Follow Us

Tin phổ biến

TAG