Dấu gạch ngang dài (em dash) và tranh cãi về việc dấu này bị coi là dấu hiệu của văn bản được viết bởi AI

-  Gần đây trên mạng xã hội, nhiều người cho rằng dấu gạch ngang dài (em dash) là dấu hiệu nhận biết văn bản được viết bởi AI tạo sinh như ChatGPT thay vì con người.

-  Podcast thời trang "LuxeGen" hướng đến khán giả thuộc thế hệ Gen Z đã gọi em dash là "ChatGPT hyphen" khi chỉ trích quảng cáo của một thương hiệu và khuyên mọi người nên loại bỏ nó.

-  Dấu gạch ngang dài, dài hơn dấu gạch nối thông thường và có độ rộng xấp xỉ chữ M, từ lâu đã được các nhà văn yêu thích như một cách để tạm dừng câu hoặc kết nối các ý với sự tinh tế.

-  Aileen Gallagher, giáo sư báo chí tại Đại học Syracuse, bày tỏ sự khó chịu: "Em dash là công cụ viết mạnh mẽ với nhiều sắc thái tinh tế. Ý tưởng cho rằng nó là dấu hiệu của văn bản AI vô hồn thực sự khiến tôi khó chịu."

-  J.T. Bushnell, giảng viên cao cấp tại Trường Viết, Văn học và Phim của Đại học Oregon State, mô tả em dash là "thanh lịch về mặt thẩm mỹ" và "nắm bắt được điều gì đó về âm điệu tự nhiên của lời nói mà các dấu câu khác không làm được."

-  Việc tìm kiếm dấu hiệu để nhận biết văn bản do AI tạo ra đã diễn ra kể từ khi các công cụ như ChatGPT xuất hiện. Đôi khi có những dấu hiệu rõ ràng, như khi người dùng quên xóa hướng dẫn hoặc đoạn hội thoại của chatbot.

-  Các công cụ phát hiện AI tuyên bố phân tích mẫu văn bản để tìm bằng chứng AI vẫn chưa hoàn hảo và thường đưa ra cảnh báo sai.

-  Một số người quan sát rằng AI thường sử dụng từ vựng không quen thuộc hoặc cứng nhắc. Từ "delve" (đào sâu) đã bị coi là từ khóa AI hiếm khi được con người sử dụng nhưng được các chatbot ưa chuộng, theo hai cuộc điều tra về các bài báo học thuật năm 2024.

-  Việc buộc tội em dash bắt đầu xuất hiện trên mạng xã hội từ đầu năm nay. Một số người tự nhận là thám tử AI cho rằng em dash hiếm khi xuất hiện ngoài văn bản AI. Những người khác nghĩ rằng chatbot có xu hướng lạm dụng dấu câu này.

-  Laurentia Romaniuk từ nhóm hành vi mô hình của OpenAI thừa nhận rằng ChatGPT có thể ưu tiên em dash, nhưng đầu ra của AI chịu ảnh hưởng nặng nề từ cách người dùng phản hồi và các mẫu viết mà họ yêu cầu bắt chước.

-  Những người hâm mộ trung thành của em dash đang phẫn nộ trước tranh cãi này. Moniza Hossain, tác giả sách thiếu nhi tại Anh, gọi em dash là "dấu câu hỗ trợ cảm xúc" của mình và thừa nhận các tác giả thường phải "định lượng" việc sử dụng nó.

-  Gallagher nói rằng các tạp chí và báo chí đã chấp nhận em dash vào những năm 1970 khi các phóng viên bắt đầu viết những câu chuyện biểu cảm và tường thuật hơn. Các blogger internet cũng làm tương tự để thêm giọng điệu và sinh khí cho bài viết.

-  Hossain chia sẻ rằng cô đã tự kiềm chế không sử dụng em dash trong một đề xuất gần đây về tiểu thuyết mới vì lo ngại biên tập viên sẽ nghi ngờ bản thảo của cô được tạo ra bởi AI. "AI đã cướp đi em dash khỏi tôi," cô nói đùa.

📌 Tranh cãi về em dash phản ánh mối quan hệ phức tạp giữa AI tạo sinh và văn học truyền thống. Trong khi một số người coi nó là dấu hiệu của văn bản AI, các nhà văn và giáo sư bảo vệ giá trị của dấu câu này trong việc thể hiện cảm xúc và kết nối ý tưởng, phản đối việc đánh đồng một công cụ văn học quý giá với sản phẩm của máy móc.

https://www.washingtonpost.com/technology/2025/04/09/ai-em-dash-writing-punctuation-chatgpt/

 

Một số người nghĩ rằng văn bản AI có dấu hiệu nhận biết — dấu gạch ngang dài. Các nhà văn không đồng ý.

Dấu gạch ngang dài đã bị chế giễu là "gạch ngang ChatGPT" — một dấu chấm câu bị trí tuệ nhân tạo lạm dụng. Điều đó không hoàn toàn đúng.

Ngày 9 tháng 4 năm 2025 lúc 1:16 chiều EDT 5 phút

Bởi Daniel Wu

Nghi ngờ rằng một email kỳ cục hoặc bài luận đại học gượng gạo có thể đã được viết bởi trí tuệ nhân tạo? Một số người nghĩ rằng có một cách chắc chắn để nhận biết — dấu gạch ngang dài.

Các nhà văn, nhà báo và những người am hiểu ngữ pháp khác — chúng tôi xin lỗi.

Trong những tháng gần đây, những người bình luận trên mạng xã hội đã chú ý đến dấu chấm câu khiêm tốn này — hoặc việc lạm dụng nó — như một dấu hiệu cho thấy văn bản được tạo ra bởi các công cụ AI tạo sinh như ChatGPT của OpenAI thay vì con người. Những bài luận kém được cho là có "một lượng dấu gạch ngang dài kiểu GPT".

"LuxeGen", một podcast thời trang nhắm đến thính giả thuộc thế hệ Gen Z, đã gọi dấu gạch ngang dài là "gạch ngang ChatGPT" khi chỉ trích quảng cáo của một thương hiệu. "Thông báo dịch vụ công: Hãy bỏ dấu gạch ngang đi," một người dẫn chương trình nói.

Không phải ai cũng đồng ý. Hầu hết những lời chỉ trích dấu gạch ngang dài đều gặp phải sự phản đối mạnh mẽ từ những người tự nhận là người hâm mộ dấu chấm câu này, vốn truyền thống gắn liền với những nét văn học tinh tế như thơ của Emily Dickinson — hoặc bản sao của những phóng viên quá nhiệt tình. Các tiểu thuyết gia và giáo sư cho biết họ sử dụng dấu chấm câu này thường xuyên và không muốn nhường nó cho máy móc.

"Dấu gạch ngang dài là một công cụ viết mạnh mẽ cũng mang tính tinh tế cao," Aileen Gallagher, giáo sư báo chí tại Đại học Syracuse cho biết. "Ý tưởng cho rằng nó là một chỉ báo của văn bản vô hồn, chết chóc được tạo ra bởi AI thực sự làm tôi khó chịu."

Dài hơn dấu gạch ngang và được đặt tên vì nó có chiều rộng xấp xỉ bằng chữ cái M, dấu gạch ngang dài từ lâu đã được các nhà văn trân trọng như một cách để tạm dừng câu hoặc kết nối các ý tưởng với một chút phong cách.

"Nó thanh lịch về mặt thẩm mỹ," J.T. Bushnell, giảng viên cao cấp tại Trường Viết, Văn học và Phim của Đại học Oregon State nói. "Nó là một dấu chấm câu không lạc lõng trong ngữ cảnh trang trọng, nhưng cũng nắm bắt được điều gì đó về ngữ điệu tự nhiên của lời nói theo cách mà các dấu chấm câu khác không làm được."

Làm thế nào nó trở thành một dấu hiệu gây tranh cãi cho người dùng AI? Việc tìm kiếm một giải pháp hoàn hảo để nhận dạng văn bản do AI tạo ra đã được tiến hành kể từ khi các công cụ như ChatGPT ra đời. Đó là một khoa học khó khăn. Các chatbot sử dụng phân tích thống kê phức tạp để dự đoán các từ — và dấu chấm câu — để kết nối thành một câu.

Đôi khi, có những dấu hiệu rõ ràng, như khi người dùng bất cẩn quên xóa hướng dẫn hoặc đoạn hội thoại của chatbot khỏi văn bản mà nó được yêu cầu tạo ra. Nhưng các phương pháp khác, như các công cụ phát hiện AI tuyên bố phân tích mẫu văn bản để tìm bằng chứng về tác phẩm của AI, không hoàn hảo và đưa ra cảnh báo sai.

Vì vậy, độc giả phải tự đưa ra suy luận về việc liệu văn bản ChatGPT có mang những đặc điểm đặc trưng hay không. Một số người đã nhận thấy rằng AI có thể sử dụng từ vựng không quy ước hoặc gượng gạo. Từ "delve" (đào sâu) đã bị gắn mác là từ khóa AI hiếm khi được con người sử dụng nhưng được chatbot ưa chuộng, theo hai cuộc điều tra về các bài báo học thuật năm 2024.

Điều tương tự có áp dụng cho dấu gạch ngang dài không?

Lời buộc tội bắt đầu xuất hiện trên mạng xã hội đầu năm nay. Một số người tự nhận là thám tử AI tuyên bố rằng dấu gạch ngang dài hiếm khi được thấy bên ngoài văn bản AI. Những người khác nghĩ rằng chatbot có xu hướng sử dụng sai hoặc lạm dụng dấu chấm câu này.

Dấu gạch ngang dài "tương đối hiếm khi con người sử dụng, có lẽ một hoặc hai lần, nếu có," một bài đăng trên X nói vào tháng 2. "Nhưng các chatbot AI thích sử dụng nó. Không biết tại sao."

Chúng tôi đã hỏi các nhà sản xuất ChatGPT xem họ có đồng ý không. Laurentia Romaniuk, thành viên nhóm hành vi mô hình của OpenAI cho biết, có thể văn bản do ChatGPT tạo ra ưa thích dấu gạch ngang dài. Nhưng cô ấy nói thêm rằng đó không phải là quy tắc cứng nhắc — đầu ra của AI chịu ảnh hưởng lớn từ cách người dùng phản hồi kết quả của nó và mọi mẫu văn bản mà người dùng yêu cầu nó bắt chước, những yếu tố luôn thay đổi.

"Mặc dù chúng tôi — và ChatGPT — có cảm tình với dấu gạch ngang dài, ưu tiên của chúng tôi là đảm bảo các mô hình của chúng tôi đang giúp người dùng truyền đạt ý tưởng của họ một cách rõ ràng và hiệu quả, bất kể phong cách nào họ chọn," Romaniuk cho biết trong một tuyên bố. "Chúng tôi đang tiếp tục cải thiện khả năng viết của ChatGPT để đạt được mục tiêu này."

Trong khi internet tranh luận, những người hâm mộ trung thành của dấu gạch ngang dài đang tức giận. Trước khi chatbot xuất hiện, các nhà văn và biên tập viên vui vẻ tranh luận về việc lạm dụng dấu gạch ngang dài. Moniza Hossain, một tác giả sách thiếu nhi có trụ sở tại Anh, gọi dấu gạch ngang dài là "dấu chấm câu hỗ trợ tinh thần" của cô.

"Chúng tôi đùa về việc chúng tôi sử dụng nó quá nhiều," cô nói. "Chúng tôi phải phân phối nó trong các chương để không sử dụng quá nhiều lần."

"Chúng ta phải bảo vệ dấu gạch ngang dài nhỏ bé đáng yêu của mình," Rebecca Crunden, một nhà văn viết về giả tưởng và khoa học viễn tưởng nói.

Gallagher, giáo sư báo chí, cho biết các tạp chí và báo chí đã áp dụng dấu gạch ngang dài vào những năm 70 khi các phóng viên bắt đầu viết những câu chuyện biểu cảm và tường thuật hơn. Các blogger internet, tìm cách thêm giọng điệu và sức sống cho các cột báo của họ, cũng làm tương tự.

Điều đó cũng có thể giải thích sự yêu thích của AI đối với dấu chấm câu này, cô nói thêm.

"Nếu [AI] phụ thuộc nhiều vào văn bản tạp chí hoặc blog, thì hai phong cách đó khá ưa thích dấu gạch ngang dài," Gallagher nói.

Các tác giả và nghệ sĩ đã phản đối việc sử dụng tác phẩm của họ để đào tạo các công cụ AI, và Hossain cùng Crunden cho biết thật đáng giận khi một nét phong cách của nhà văn như dấu gạch ngang dài giờ đây có thể bị liên kết tiêu cực với một công cụ đã học từ những từ ngữ của họ.

Bushnell, giảng viên viết lách, cho biết ông hy vọng sự xem xét kỹ lưỡng mà AI đã mang lại cho dấu gạch ngang dài có thể khuyến khích nhiều người tìm hiểu về nó và sử dụng nó đúng cách trong bài viết của họ.

Hossain lo sợ nó sẽ có tác động ngược lại. Cô kể rằng gần đây cô đã ngăn mình sử dụng dấu gạch ngang dài trong một đề xuất viết cho một tiểu thuyết mới - cô không muốn biên tập viên nghi ngờ bản đề xuất của cô được tạo ra bởi AI.

"AI đã cướp đi dấu gạch ngang dài của tôi," cô đùa. "Thật kinh khủng."

Bởi Daniel Wu Daniel Wu là phóng viên tại bàn Bài viết Tổng hợp của The Washington Post. Anh gia nhập The Post làm thực tập sinh tại bàn Metro vào năm 2022 và trước đây đã làm việc cho Seattle Times và San Jose Mercury News.

Thảo luận

© Sóng AI - Tóm tắt tin, bài trí tuệ nhân tạo