• Các công cụ kiểm tra nội dung AI đang ngày càng trở nên khó vượt qua hơn. Chúng sử dụng nhiều kỹ thuật để phân tích văn bản và phát hiện nội dung do AI tạo ra.
• Phân tích văn bản là bước đầu tiên. Văn bản được chia thành các token và chuẩn hóa bằng cách loại bỏ dấu câu và các chỉ báo không cần thiết khác.
• Véc-tơ hóa được sử dụng để chuyển đổi văn bản thành mã hash toán học để so sánh với các văn bản khác.
• Nhận thức ngữ cảnh giúp xem xét bối cảnh sử dụng các cụm từ để xác định các cụm từ phổ biến và gán trọng số cho chúng. Các kết nối ngữ cảnh không phổ biến được đánh giá cao hơn là do con người viết.
• Phân tích ngữ nghĩa cố gắng hiểu ý nghĩa của văn bản thay vì chỉ xem xét chuỗi từ. Điều này cho phép cân bằng giữa nhận thức ngữ cảnh và hiểu ý định của người viết.
• Công cụ kiểm tra của OpenAI có thể so sánh tóm tắt ý nghĩa của một đoạn văn với toàn bộ cơ sở kiến thức của ChatGPT để xem độ tương đồng với nội dung ChatGPT có thể tạo ra.
• N-gram, là các chuỗi từ, được sử dụng để trích xuất ngữ cảnh và ý nghĩa. Cấu trúc ngữ pháp cũng được xem xét để tìm các mẫu phản ánh nội dung do AI viết.
• Quá trình so sánh liên quan đến việc đối chiếu văn bản với toàn bộ internet, sử dụng các thuật toán tìm kiếm truyền thống để tìm các kết quả khớp chính xác, diễn đạt lại và khớp mờ.
• Các công ty có cơ sở dữ liệu lớn như OpenAI, Google, Microsoft và Meta có lợi thế trong việc so sánh văn bản.
• Hầu hết các công cụ kiểm tra nội dung cung cấp báo cáo cho người dùng, lý tưởng nhất là hiển thị các khu vực trong tài liệu mà công cụ kiểm tra cho là đáng ngờ.
• Các công cụ kiểm tra AI đang được cải thiện. Trong một bài kiểm tra vào đầu năm 2023, hầu hết đều không phân biệt được văn bản do con người và AI tạo ra. Đến giữa năm 2024, khoảng một nửa trong số đó đã làm đúng.
• Đây là một cuộc chạy đua vũ trang. Khi các công cụ kiểm tra AI trở nên tốt hơn, một số dịch vụ AI sẽ thêm vào các lỗi và phong cách của con người để giúp những kẻ gian lận. Sau đó, các công cụ kiểm tra AI sẽ cải thiện để phát hiện điều này, và cứ tiếp tục như vậy.
📌 Các công cụ kiểm tra nội dung AI sử dụng nhiều kỹ thuật phức tạp như phân tích văn bản, véc-tơ hóa, nhận thức ngữ cảnh và so sánh internet. Đến giữa năm 2024, khoảng 50% công cụ có thể phân biệt chính xác văn bản của con người và AI. Cuộc chạy đua vũ trang giữa công nghệ kiểm tra và gian lận AI vẫn đang tiếp diễn.
https://www.zdnet.com/article/how-do-ai-checkers-work/