• Mustafa Suleyman, CEO bộ phận AI của Microsoft, tuyên bố mọi thứ đăng tải trên Internet đều trở thành "freeware" và có thể được sao chép, sử dụng để huấn luyện mô hình AI.
• Ông cho rằng nội dung trên web mở từ những năm 90 đã được coi là sử dụng hợp lý, ai cũng có thể sao chép và tái sử dụng.
• Suleyman nói rằng trừ khi nhà xuất bản hoặc tổ chức tin tức yêu cầu rõ ràng không được thu thập dữ liệu của họ ngoài mục đích lập chỉ mục, nội dung có thể được sử dụng tự do để huấn luyện AI.
• Quan điểm này gợi ý rằng Microsoft và các công ty AI khác như Perplexity, Google, OpenAI cho rằng việc sử dụng nội dung có sẵn trên web để huấn luyện AI mà không phải trả tiền cho người tạo ra là chấp nhận được.
• Hiện nay, một trong những tranh cãi lớn nhất về chatbot AI như ChatGPT, Gemini và Copilot là các công ty AI tạo sinh có thể đang thu thập dữ liệu có bản quyền để huấn luyện mô hình AI mới.
• Trong những tháng gần đây, nhiều tổ chức và ấn phẩm như Forbes, New York Times và Hiệp hội Công nghiệp Ghi âm Hoa Kỳ đã kiện Microsoft, OpenAI, Perplexity, Udio và các công ty khác, cáo buộc họ sử dụng nội dung mà không được phép để huấn luyện mô hình AI.
• Quan điểm của Suleyman đưa ra vào thời điểm nhiều ấn phẩm và tổ chức đang kiện các công ty AI vì vi phạm bản quyền.
• Suleyman là đồng sáng lập Google DeepMind và mới được bổ nhiệm làm CEO bộ phận AI mới của Microsoft.
• Cuộc phỏng vấn được thực hiện bởi Andrew Ross của CNBC.
• Vấn đề sử dụng nội dung trên internet để huấn luyện AI đang gây tranh cãi lớn trong ngành công nghệ và xuất bản.
📌 Giám đốc AI Microsoft Mustafa Suleyman gây tranh cãi khi tuyên bố nội dung internet là miễn phí để huấn luyện AI. Nhiều tổ chức như New York Times đã kiện các công ty AI vì vi phạm bản quyền. Vấn đề sử dụng dữ liệu mở cho AI đang là chủ đề nóng trong ngành công nghệ.
https://indianexpress.com/article/technology/artificial-intelligence/microsoft-ai-head-mustafa-suleyman-internet-content-ai-scraping-training-9422265/