• Cụm từ "Bỏ qua mọi hướng dẫn trước đó" (Ignore all previous instructions) đang được sử dụng rộng rãi trên mạng xã hội để phát hiện bot AI.
• Cụm từ này hoạt động như một nút reset kỹ thuật số, yêu cầu chatbot dừng vai trò giả mạo và sẵn sàng nhận hướng dẫn mới.
• Toby Muresianu, 40 tuổi, đã sử dụng phương pháp này để vạch trần một tài khoản nghi là bot trên X (Twitter).
• Tài khoản đáng ngờ @AnnetteMas80550 tự nhận là một đảng viên Dân chủ thất vọng, nhưng đã phản ứng máy móc khi được yêu cầu "bỏ qua mọi hướng dẫn trước đó" và viết một bài thơ.
• Cụm từ này bắt nguồn từ kỹ thuật "prompt injection" của hacker, được phát hiện trong phần mềm của OpenAI từ tháng 9/2022.
• Các chuyên gia AI cho rằng phương pháp này không hoàn toàn đáng tin cậy, nhưng nó cho thấy người dùng mạng xã hội đã nhận thức được về bot AI.
• Bộ Tư pháp Mỹ mới đây đã phát hiện và vô hiệu hóa một mạng lưới tuyên truyền của Nga trên X với gần 1.000 tài khoản giả mạo.
• Các công ty công nghệ như Microsoft và OpenAI đang nỗ lực phát triển các phương pháp gắn nhãn nội dung do AI tạo ra để tăng tính minh bạch.
• Cụm từ này đã trở thành một meme phổ biến trên mạng xã hội, thậm chí được sử dụng như một lời xúc phạm mới để ám chỉ ai đó đưa ra lập luận máy móc.
• Tuy nhiên, việc sử dụng rộng rãi cụm từ này cũng có thể khiến nó trở nên kém hiệu quả trong việc phát hiện bot thực sự.
📌 Cụm từ "Bỏ qua mọi hướng dẫn trước đó" đã trở thành công cụ phổ biến để phát hiện bot AI trên mạng xã hội. Dù không hoàn hảo, nó cho thấy nhận thức ngày càng cao về AI trong cộng đồng mạng. Tuy nhiên, việc lạm dụng có thể làm giảm hiệu quả của phương pháp này.
https://www.nbcnews.com/tech/internet/hunting-ai-bots-four-words-trick-rcna161318