• Suchir Balaji, cựu nhà nghiên cứu AI tại OpenAI (làm việc đến tháng 8/2024), đã lên tiếng tố cáo công ty vi phạm luật bản quyền
• Balaji từng phụ trách thu thập dữ liệu cho mô hình GPT-4 multimodal của OpenAI, ban đầu anh coi đây chỉ là dự án nghiên cứu và không nghĩ nó sẽ trở thành chatbot tích hợp công cụ tạo ảnh AI
• Cựu nhân viên này cho biết anh bị thu hút bởi nghiên cứu AI vì tin công nghệ này có thể mang lại lợi ích cho thế giới, nhưng giờ đây anh nghĩ nó gây hại nhiều hơn lợi
• Theo Balaji, OpenAI đang đe dọa chính những đối tượng mà công ty lấy dữ liệu để xây dựng sản phẩm - bao gồm cá nhân, doanh nghiệp và các dịch vụ internet
• OpenAI xây dựng các sản phẩm như ChatGPT và DALL-E bằng cách lấy dữ liệu từ web và đưa vào chương trình machine learning để học hỏi
• Phía OpenAI khẳng định việc sử dụng dữ liệu công khai của họ được bảo vệ bởi nguyên tắc "fair use" (sử dụng hợp lý) và các tiền lệ pháp lý
• Tuy nhiên, lập luận về fair use chưa được kiểm chứng tại tòa án và OpenAI đang đối mặt nhiều vụ kiện, chủ yếu từ các tác giả văn bản, bao gồm The New York Times
• Balaji phản bác rằng hoạt động của OpenAI không đáp ứng tiêu chí fair use vì công ty đang sao chép dữ liệu có bản quyền và tổng hợp lại
📌 Cựu nhân viên OpenAI đã công khai chỉ trích việc thu thập dữ liệu của công ty, cho rằng đây là hành vi vi phạm bản quyền. Vấn đề này đang gây tranh cãi lớn khi OpenAI phải đối mặt với nhiều vụ kiện, trong khi vẫn bảo vệ quan điểm về việc sử dụng dữ liệu hợp pháp theo nguyên tắc fair use.
https://petapixel.com/2024/10/25/former-openai-employee-condemns-the-companys-data-scraping-practices/