AI ảnh-video-music-âm thanh 2024-06-08 07:45:19

stability ai ra mắt công cụ tạo nhạc từ văn bản stable audio open

- Stability AI, nổi tiếng với công cụ tạo hình ảnh Stable Diffusion, đã ra mắt mô hình AI mở mới cho việc tạo âm thanh và nhạc, gọi là Stable Audio Open.
- Stable Audio Open được huấn luyện hoàn toàn trên nhạc miễn phí bản quyền và có thể biến mô tả văn bản thành bản ghi âm dài tới 47 giây.
- Ví dụ về các bản ghi âm được tạo ra từ các mô tả như "tiếng chim Blackbird, mùa hè, hoàng hôn trong rừng" và "nhịp rock chơi trong studio, trống phiên trên bộ trống acoustic" đã được cung cấp.
- Stable Audio Open dựa trên công cụ tạo âm thanh thương mại của công ty, Stable Audio, ra mắt lần đầu vào tháng 9 và được cải tiến với phiên bản Stable Audio 2.0 vào tháng 4, tăng cường độ rõ ràng và kéo dài thời lượng âm thanh.
- Khác với mô hình thương mại được huấn luyện trên nguồn nhạc có bản quyền, Stable Audio Open chỉ được huấn luyện trên 486.000 mẫu từ các thư viện nhạc miễn phí như Free Music Archive và FreeSound, do đó chất lượng âm thanh có thể không bằng.
- Công cụ này được thiết kế cho các nhạc sĩ và nhà làm phim cần tạo nhịp trống, đoạn nhạc cụ, âm thanh môi trường và các yếu tố sản xuất.
- Ngoài ra, công cụ còn có thể chỉnh sửa các bài hát hiện có hoặc áp dụng phong cách mới, như jazz mượt mà, cho một bài hát ở phong cách khác.
- Một lợi ích thú vị của Stable Audio Open là người dùng có thể tinh chỉnh mô hình với âm thanh của riêng họ, ví dụ như tải lên các bản ghi trống hoặc đoạn guitar của mình để tạo ra âm thanh mới theo phong cách riêng.
- Tuy nhiên, tính mở của Stable Audio Open cũng giới hạn tính hữu ích của nó. Mô hình này không nhằm tạo ra các bài hát hoàn chỉnh mà chỉ tạo ra các đoạn âm thanh ngắn dùng làm hiệu ứng âm nhạc. Để tạo ra các bài hát hoàn chỉnh hoặc có lời, người dùng nên sử dụng dịch vụ cao cấp Stable Audio 2.0 hoặc nền tảng khác như của Suno Inc.
- Stability AI thừa nhận rằng mô hình không hoạt động tốt khi người dùng đưa ra yêu cầu bằng các ngôn ngữ khác ngoài tiếng Anh, do thiếu dữ liệu huấn luyện phù hợp.
- Mặc dù được gọi là nguồn mở, Stable Audio Open chỉ có sẵn dưới giấy phép cộng đồng nghiên cứu phi thương mại của Stability AI, cấm sử dụng thương mại bất kỳ âm thanh nào được tạo ra.
- Quyết định ra mắt phiên bản mở của công cụ tạo âm thanh đến không lâu sau khi phó chủ tịch âm thanh tạo sinh của Stability AI, Ed Newton-Rex, từ chức vì chính sách sử dụng tác phẩm có bản quyền để huấn luyện mô hình của công ty.
- Vấn đề bản quyền trở thành một trong những vấn đề gây tranh cãi nhất xung quanh AI khi công nghệ này ngày càng phổ biến. Nhiều nhạc sĩ và các nghệ sĩ sáng tạo khác lo ngại rằng họ có thể bị thay thế bởi các mô hình AI được huấn luyện trên tác phẩm của họ.
- Stability AI cho rằng việc sử dụng nhạc có bản quyền để huấn luyện mô hình AI là hợp lý theo nguyên tắc "sử dụng hợp lý", nhưng có tranh cãi về định nghĩa chính xác của "sử dụng hợp lý".
- Trong thư từ chức, Newton-Rex lập luận rằng việc huấn luyện AI trên tác phẩm có bản quyền không thể được coi là sử dụng hợp lý vì ảnh hưởng đến giá trị thị trường tiềm năng của nội dung đó.
- Hơn 200 nghệ sĩ lớn trên thế giới đã ký một bức thư ngỏ phản đối việc sử dụng AI trong âm nhạc, gọi đó là "cuộc tấn công vào sự sáng tạo của con người".
- Một số nhà lập pháp cũng có cùng quan điểm. Ví dụ, bang Tennessee đã thông qua một luật mới nhằm bảo vệ tác phẩm của nhạc sĩ khỏi bị lạm dụng bởi AI.

📌 Stability AI ra mắt công cụ Stable Audio Open, một mô hình AI mở cho phép tạo âm thanh từ mô tả văn bản, nhưng chỉ tạo ra các đoạn âm thanh ngắn và không thể sử dụng cho mục đích thương mại. Công cụ này được thiết kế cho các nhạc sĩ và nhà làm phim, nhưng có hạn chế về ngôn ngữ và chất lượng âm thanh so với phiên bản thương mại.

https://siliconangle.com/2024/06/05/stability-ai-debuts-open-version-stable-audio-music-generator-tool/

Không có file đính kèm.

Nguồn tham khảo

148

Thảo luận

12,345 Fans 12,345 Followers 12,345 Subscribers

Tin phổ biến

AI coding assistant

Cursor AI - IDE thay thế VS Code với trợ lý AI tích hợp

AI giáo dục

UNESCO ra mắt 2 khung năng lực AI mới cho học sinh và giáo viên

AI giáo dục

Khung năng lực AI cho giáo viên của UNESCO

AI so sánh

OpenAI hay tự xây dựng: so sánh chi phí thực tế của việc tự lưu trữ các mô hình ngôn ngữ lớn

Apple joins AI fray with release of model framework

The AI skills gap is becoming incredibly troubling for companies everywhere

AI doanh nghiệp

10 use-case hàng đầu của AI trong kinh doanh

AI so sánh

Phân tích chuyên sâu về RAG, AI Agents và Agentic RAG

AI kiến thức-khóa học

Hướng dẫn toàn diện về lập trình AI với Cursor cho người mới bắt đầu

The AI Frenzy, Fed Meets, Hunter Biden: Your Sunday US Briefing

TAG

AI giáo dục AI sinh-y-duoc AI nghệ thuật AI pháp lý-quản trị-chủ quyền AI models AI xã hội AI prompts AI kiến thức-khóa học AI công nghiệp-lĩnh vực AI edge AI viễn thông AI tools AI chính phủ AI cybersecurity AI so sánh AI đạo đức AI tips AI market AI quân sự AI an toàn-an ninh-techwar AI việc làm AI doanh nghiệp OpenAI ChatGPT AI môi trường-năng lượng AI skill-talent AI & công nghệ khác AI nghiên cứu AI chips-hardware-compute AI vs con người AI coding assistant AI mở-nguồn mở AI năng suất AI startup-M&A AI tương lai AI báo chí AI data AI bản quyền AI PC AI riêng tư AI deepfake-ảo giác-ANTT AI ảnh-video-music-âm thanh AI minh bạch AI nhỏ AI nông nghiệp-thực phẩm AI ngân hàng-tài chính AI giao thông AI smartphone AI robotics-auto-agents AI consumer devices AI manufacturing AI benchmark Telecom AI thành công-thất bại Digital Semi-Cloud-DC-Green HTS STI FAQ

SongAI

Tin nóng

stability ai ra mắt công cụ tạo nhạc từ văn bản stable audio open

Thảo luận

Follow Us

Tin phổ biến

TAG