
Image by AbsolutVision, from Unsplash
Nhà Xuất Bản Chặn Bot AI Để Bảo Vệ Nội Dung
Các nhà xuất bản tin tức tiếp tục đấu tranh chống lại các bot AI, kiện các công ty công nghệ, cảnh báo rằng việc lấy dữ liệu có thể gây nguy hiểm cho ngành báo chí, hệ thống bồi thường công bằng, cũng như tương lai của web mở.
Đang vội? Dưới đây là những thông tin quan trọng:
- Công cụ AI như ChatGPT đã giảm lượng truy cập vào các trang tin tức.
- Cloudflare đã ra mắt các công cụ để giúp chặn các công cụ thu thập dữ liệu AI không được phép.
- Reddit và iFixit đã kiện hoặc chặn các công ty AI như Anthropic.
Theo một báo cáo mới do The Wall Street Journal (WSJ) công bố, các nhà xuất bản tin tức đang đối phó với các công ty AI lấy nội dung từ trang web của họ mà không có sự đền bù. Khi các công cụ AI như ChatGPT và Gemini của Google ngày càng phát triển, nhiều công ty truyền thông đang cố gắng chặn các bot sử dụng công việc của họ mà không có sự cho phép.
“Bạn muốn con người đọc trang web của mình, không phải bot, đặc biệt là những bot không mang lại bất kỳ giá trị nào cho bạn,” Nicholas Thompson, CEO của The Atlantic nói, công ty này đã ký hợp đồng cấp phép với OpenAI nhưng dự định chặn các công ty AI khác, theo như đã được WSJ báo cáo.
Chiến lược này, được biết đến với tên gọi “scraping,” đã tồn tại từ những ngày đầu của Google. Hồi đó, các công cụ tìm kiếm làm tăng lưu lượng truy cập đến các trang web của các nhà xuất bản. Bây giờ, AI chatbot cho phép tóm tắt tin tức mà điều hướng người đọc tránh khỏi việc truy cập vào nguồn gốc ban đầu của họ. Sự kết hợp giữa giảm lưu lượng truy cập do bot và sự suy giảm doanh thu từ quảng cáo đã trở thành vấn đề phổ biến đối với nhiều nhà xuất bản.
Để đẩy lùi, các nhà xuất bản đang tìm đến các công ty công nghệ như Cloudflare, công ty đã gần đây ra mắt các công cụ để cho phép các trang web kiểm soát việc có cho phép bot AI truy cập nội dung hay không. Neil Vogel, CEO của Dotdash Meredith, công ty cũng cấp phép nội dung cho OpenAI, đã nói rằng, “Những người tạo ra tài sản trí tuệ cần được bảo vệ, nếu không sẽ không còn ai tạo ra tài sản trí tuệ nữa,” theo như được WSJ đưa tin.
Một số công ty, như Reddit và iFixit, đã tiến hành các hành động pháp lý. Reddit đã kiện công ty AI Anthropic vì đã “scraping” hơn 100,000 lần mặc dù đã được yêu cầu dừng lại. iFixit cho biết Anthropic đã tấn công máy chủ của họ một triệu lần trong một ngày.
Cuộc chiến cũng đang được tiến hành tại tòa án. The New York Times đang kiện Microsoft và OpenAI, trong khi News Corp và các công ty con của họ đang đối đầu với Perplexity. BBC cũng đã đe dọa kiện startup AI Perplexity, cáo buộc nó đã lấy nội dung của mình để huấn luyện mô hình mặc định.
Trong khi đó, một số người lo ngại rằng các quy định chống lấy cắp thông tin nghiêm ngặt hơn có thể cản trở các mục đích hợp pháp như nghiên cứu học thuật, như WSJ đã ghi nhận.
Như Shayne Longpre của Sáng kiến Nguồn gốc Dữ liệu đã cảnh báo, “Internet đang được phân chia cho người trả giá cao nhất. Điều này thực sự rất xấu cho sự tập trung thị trường và sự mở cửa,” như được WSJ đưa tin.