- Stability AI, nổi tiếng với công cụ tạo hình ảnh Stable Diffusion, đã ra mắt mô hình AI mở mới cho việc tạo âm thanh và nhạc, gọi là Stable Audio Open.
- Stable Audio Open được huấn luyện hoàn toàn trên nhạc miễn phí bản quyền và có thể biến mô tả văn bản thành bản ghi âm dài tới 47 giây.
- Ví dụ về các bản ghi âm được tạo ra từ các mô tả như "tiếng chim Blackbird, mùa hè, hoàng hôn trong rừng" và "nhịp rock chơi trong studio, trống phiên trên bộ trống acoustic" đã được cung cấp.
- Stable Audio Open dựa trên công cụ tạo âm thanh thương mại của công ty, Stable Audio, ra mắt lần đầu vào tháng 9 và được cải tiến với phiên bản Stable Audio 2.0 vào tháng 4, tăng cường độ rõ ràng và kéo dài thời lượng âm thanh.
- Khác với mô hình thương mại được huấn luyện trên nguồn nhạc có bản quyền, Stable Audio Open chỉ được huấn luyện trên 486.000 mẫu từ các thư viện nhạc miễn phí như Free Music Archive và FreeSound, do đó chất lượng âm thanh có thể không bằng.
- Công cụ này được thiết kế cho các nhạc sĩ và nhà làm phim cần tạo nhịp trống, đoạn nhạc cụ, âm thanh môi trường và các yếu tố sản xuất.
- Ngoài ra, công cụ còn có thể chỉnh sửa các bài hát hiện có hoặc áp dụng phong cách mới, như jazz mượt mà, cho một bài hát ở phong cách khác.
- Một lợi ích thú vị của Stable Audio Open là người dùng có thể tinh chỉnh mô hình với âm thanh của riêng họ, ví dụ như tải lên các bản ghi trống hoặc đoạn guitar của mình để tạo ra âm thanh mới theo phong cách riêng.
- Tuy nhiên, tính mở của Stable Audio Open cũng giới hạn tính hữu ích của nó. Mô hình này không nhằm tạo ra các bài hát hoàn chỉnh mà chỉ tạo ra các đoạn âm thanh ngắn dùng làm hiệu ứng âm nhạc. Để tạo ra các bài hát hoàn chỉnh hoặc có lời, người dùng nên sử dụng dịch vụ cao cấp Stable Audio 2.0 hoặc nền tảng khác như của Suno Inc.
- Stability AI thừa nhận rằng mô hình không hoạt động tốt khi người dùng đưa ra yêu cầu bằng các ngôn ngữ khác ngoài tiếng Anh, do thiếu dữ liệu huấn luyện phù hợp.
- Mặc dù được gọi là nguồn mở, Stable Audio Open chỉ có sẵn dưới giấy phép cộng đồng nghiên cứu phi thương mại của Stability AI, cấm sử dụng thương mại bất kỳ âm thanh nào được tạo ra.
- Quyết định ra mắt phiên bản mở của công cụ tạo âm thanh đến không lâu sau khi phó chủ tịch âm thanh tạo sinh của Stability AI, Ed Newton-Rex, từ chức vì chính sách sử dụng tác phẩm có bản quyền để huấn luyện mô hình của công ty.
- Vấn đề bản quyền trở thành một trong những vấn đề gây tranh cãi nhất xung quanh AI khi công nghệ này ngày càng phổ biến. Nhiều nhạc sĩ và các nghệ sĩ sáng tạo khác lo ngại rằng họ có thể bị thay thế bởi các mô hình AI được huấn luyện trên tác phẩm của họ.
- Stability AI cho rằng việc sử dụng nhạc có bản quyền để huấn luyện mô hình AI là hợp lý theo nguyên tắc "sử dụng hợp lý", nhưng có tranh cãi về định nghĩa chính xác của "sử dụng hợp lý".
- Trong thư từ chức, Newton-Rex lập luận rằng việc huấn luyện AI trên tác phẩm có bản quyền không thể được coi là sử dụng hợp lý vì ảnh hưởng đến giá trị thị trường tiềm năng của nội dung đó.
- Hơn 200 nghệ sĩ lớn trên thế giới đã ký một bức thư ngỏ phản đối việc sử dụng AI trong âm nhạc, gọi đó là "cuộc tấn công vào sự sáng tạo của con người".
- Một số nhà lập pháp cũng có cùng quan điểm. Ví dụ, bang Tennessee đã thông qua một luật mới nhằm bảo vệ tác phẩm của nhạc sĩ khỏi bị lạm dụng bởi AI.
📌 Stability AI ra mắt công cụ Stable Audio Open, một mô hình AI mở cho phép tạo âm thanh từ mô tả văn bản, nhưng chỉ tạo ra các đoạn âm thanh ngắn và không thể sử dụng cho mục đích thương mại. Công cụ này được thiết kế cho các nhạc sĩ và nhà làm phim, nhưng có hạn chế về ngôn ngữ và chất lượng âm thanh so với phiên bản thương mại.
https://siliconangle.com/2024/06/05/stability-ai-debuts-open-version-stable-audio-music-generator-tool/