• Nhiều trang web lớn đang chặn bot của Apple thu thập dữ liệu để huấn luyện AI, theo báo cáo của Wired.
• Các công ty truyền thông đã thay đổi file robots.txt để chặn Applebot bao gồm The New York Times, The Atlantic, The Financial Times, Gannett, Vox Media và Condé Nast.
• Mạng xã hội như Facebook, Instagram và Tumblr cũng xác nhận đã chặn Apple thu thập dữ liệu từ trang web của họ.
• Một số công ty như Vox, Condé Nast và The Atlantic đã ký thỏa thuận cấp phép nội dung với OpenAI.
• The New York Times đang kiện OpenAI về vi phạm bản quyền.
• Facebook và Instagram thuộc sở hữu của Meta - đối thủ cạnh tranh của Apple trong lĩnh vực AI.
• Apple đã ký thỏa thuận với OpenAI để tích hợp ChatGPT vào các sản phẩm của họ.
• Ngành công nghiệp AI đang cạnh tranh gay gắt về quyền truy cập vào dữ liệu huấn luyện chất lượng cao do con người tạo ra.
• Các trang web đã chặn cụ thể "Apple-Extended" - một bot thu thập dữ liệu của Apple để huấn luyện các mô hình AI nền tảng.
• Việc chặn Applebot-Extended không ngăn cản Applebot gốc thu thập dữ liệu cho Siri và Spotlight của Apple.
• Sự phân biệt này cho thấy Apple thận trọng về vấn đề bản quyền và sở hữu trí tuệ trong kỷ nguyên AI.
• The New York Times không phải công ty duy nhất kiện các nhà phát triển AI.
• Apple có thể muốn tránh thu thập dữ liệu gây tranh cãi hoặc đang trong vụ kiện, đặc biệt khi họ đã hợp tác với OpenAI.
• Động thái này của Apple được ví như "con chim hoàng yến trong mỏ than" trị giá hàng tỷ đô la, phản ánh xu hướng trong ngành AI.
📌 Apple đối mặt với thách thức lớn khi nhiều trang web hàng đầu chặn bot thu thập dữ liệu AI của họ. Điều này phản ánh cuộc cạnh tranh khốc liệt về nguồn dữ liệu chất lượng cao trong ngành AI, với các thỏa thuận và vụ kiện đang định hình lại cách thức hoạt động của ngành.
https://futurism.com/the-byte/apple-ai-training