Theo chia sẻ mới đây từ Business Insider, CEO OpenAI, chủ sở hữu chatbot AI ChatGPT đã thừa nhận việc sử dụng bot để thu thập dữ liệu web phục vụ cho việc đào tạo mô hình AI của mình.
Trong thế giới kỹ thuật số, việc các nền tảng hay phần mềm sử dụng bot (cơ chế hoạt động giống như các con nhện len lỏi khắp nơi để thu thập dữ liệu) không còn là chuyện mới mặc dù có không ít chủ sở hữu nền tảng cố tình che dấu nó.
Con bot đầu tiên (và cũng là mạnh nhất) phải kể đến có lẽ là Googlebot, nó tự động thu thập thông tin từ các trang web và sau đó, thông qua cái gọi là “thuật toán xếp hạng” Google có thể xếp hạng và hiển thị thông tin đó trên kết quả tìm kiếm (SERPs).
Điều này cũng liên quan trực tiếp đến cơ chế hoạt động hiện tại của nền kinh tế web hay nền kinh tế internet: Google thu thập nội dung của bạn và sau đó “trả” lại cho bạn lưu lượng truy cập (web traffic), thứ đóng vai trò là động lực để bạn tiếp tục sản xuất và đăng tải lên nhiều nội dung hơn.
Trong thế giới AI mới, quá trình này thậm chí còn diễn ra theo cách “khốc liệt” hơn.
Trí tuệ nhân tạo (AI) đang phá vỡ “cuộc giao dịch mua bán” lớn nhất trên nền kinh tế web.
Những gì được mô tả ở trên về cơ bản là sẽ diễn ra một cách “êm đẹp” (và có thể còn kéo dài mãi mãi) nếu không có sự trỗi dậy mới đây của công nghệ AI mà cụ thể là AI tổng quát (Generative AI).
Các mô hình ngôn ngữ lớn có trong các chatbot AI như ChatGPT hay thậm chí là Google Bard của chính Google (ra đời để cạnh tranh và giảm bớt rủi ro từ các ứng dụng như ChatGPT) đang làm thay đổi cách thức vận hành của nền kinh tế web.
Trong một chia sẻ mới đây, CEO của OpenAI đã thừa nhận rằng chatbot này cũng có một con bot tương tự như của Google, liên tục truy cập các nền tảng web để thu thập dữ liệu, các dữ liệu có được chính là nguồn đầu vào để đào tạo các mô hình AI.
Một câu hỏi lớn được đặt ra cho các chủ sở hữu của các nền tảng web hay các nhà sáng tạo nội dung số đó là liệu họ có chấp nhận để một ứng dụng khác thu thập dữ liệu do chính họ tạo ra để rồi sau đó chính bên thu thập dữ liệu lại tạo ra một sản phẩm (ví dụ như ChatGPT) cạnh tranh trực tiếp với chính họ hoặc thậm chí là đào thải họ.
AI và “nỗi đau” bản quyền.
Một trong những vấn đề lớn khác của các nhà sáng tạo nội dung với các chatbot AI đó là ai mới thực sự là người sở hữu bản quyền của nội dung, nội dung gốc từ các nền tảng web do chính con người xây dựng hay của các chatbot AI vốn sản xuất nội dung dựa trên chính nội dung của các nhà sáng tạo.
Trong khi vấn đề tranh chấp bản quyền nội dung mới chỉ đang ở giai đoạn chớm nở (và chưa có hồi kết), rõ ràng là việc các nhà sáng tạo để các chatbot “tự do” thu thập dữ liệu của họ để đào tạo các mô hình AI chính là họ “đang tự làm hại chính mình”.