- Stability AI giới thiệu SD3 Medium, mô hình AI nguồn mở tạo ảnh từ văn bản tiên tiến nhất trong series Stable Diffusion 3.
- SD3 Medium được xây dựng trên 2 tỷ tham số, hỗ trợ tạo ảnh chân thực, tuân thủ các lệnh văn bản và phong cách phức tạp, hiểu và render văn bản không lỗi chính tả.
- Mô hình tập trung vào khả năng tạo từ và đánh vần chính xác, vượt trội so với các bộ tạo ảnh từ văn bản trước đây nhờ Kiến trúc Transformer Khuếch tán.
- Người dùng có thể tinh chỉnh nhanh mô hình bằng các bộ dữ liệu nhỏ để tùy chỉnh đầu ra, phù hợp cho các dự án cần hoàn thành nhanh.
- SD3 Medium có kích thước tham số nhỏ gọn (2 tỷ) so với các mô hình nặng hơn (800 triệu - 8 tỷ), tối ưu để chạy trên PC với GPU tiêu dùng/gaming.
- Stability hợp tác với Nvidia để tăng cường hiệu suất các mô hình SD trên GPU RTX và TensorRT, mang lại mức tăng 50% hiệu năng.
- Công ty cũng hợp tác với AMD để tối ưu hóa suy luận cho SD3 Medium trên các thiết bị APU và GPU tiêu dùng.
- Stable Diffusion 3 có sẵn qua API của công ty và trọng số mô hình được mở mã nguồn cho cộng đồng.
📌 SD3 Medium là mô hình AI tạo ảnh từ văn bản tiên tiến nhất của Stability AI với 2 tỷ tham số, nhiều tính năng vượt trội, tối ưu hóa hiệu suất trên phần cứng Nvidia (tăng 50%) và AMD, đồng thời mở mã nguồn cho cộng đồng phát triển.
https://siliconangle.com/2024/06/12/stability-ai-releases-sd3-medium-advanced-text-image-generating-ai-model-yet/