- Theo phân tích của Press Gazette, 61 trên 106 trang web tin tức hàng đầu bằng tiếng Anh đã áp dụng các biện pháp chặn ít nhất một AI web crawler.
- Trong số đó, 32 trang web chặn hai hoặc nhiều AI crawlers, với một số trang thậm chí chặn tới năm.
- GPTBot, AI crawler liên quan đến ChatGPT của OpenAI, bị chặn bởi 56.6% các trang web được khảo sát.
- Một số nhà xuất bản lớn chọn chặn các AI bots nhất định, trong khi những người khác không áp đặt bất kỳ hạn chế nào. Ví dụ, Mirror, Express, Manchester Evening News, Ladbible, Unilad, và các ấn phẩm dưới sự quản lý của Lebedev (bao gồm Independent và Evening Standard) cho phép truy cập không hạn chế đối với AI crawlers.
- Politico, một công ty con của Axel Springer, cho phép truy cập AI crawlers do có thỏa thuận chia sẻ nội dung với OpenAI.
- Daily Beast, thuộc sở hữu của IAC, không chặn bất kỳ AI bots nào mặc dù chủ tịch của công ty ủng hộ việc các công ty AI bồi thường cho các nhà xuất bản.
- Một số trang web bảo thủ về mặt chính trị như GB News, Newsmax, Zero Hedge, Breitbart, và Fox News không chặn AI crawlers, tạo nên sự khác biệt so với các ấn phẩm khác thuộc sở hữu của Murdoch.
📌 Trong bối cảnh công nghệ phát triển không ngừng, việc các trang web tin tức hàng đầu áp dụng các biện pháp chặn AI crawlers đang trở thành một xu hướng đáng chú ý. Với 61 trên 106 trang đã chặn ít nhất một AI bot và 32 trang chặn hai hoặc nhiều, rõ ràng là có một sự phân biệt rõ ràng trong cách tiếp cận giữa các nhà xuất bản. Đặc biệt, việc GPTBot bị chặn bởi hơn một nửa các trang web khảo sát cho thấy mức độ quan tâm cao đối với việc kiểm soát nội dung được AI truy cập và sử dụng. Tuy nhiên, sự đa dạng trong quyết định của các nhà xuất bản, từ việc cho phép truy cập không hạn chế đến việc chặn hoàn toàn, phản ánh một bức tranh phức tạp về quan hệ giữa công nghệ AI và ngành công nghiệp tin tức.
Citations:
[1] https://www.cryptopolitan.com/are-top-news-websites-blocking-ai-crawlers/