Nhận diện dấu hiệu Chatbot viết bài: Wikipedia chỉ ra những “thiếu tự nhiên” của văn bản AI

Trong thời đại trí tuệ nhân tạo, văn bản do Chatbot AI sinh ra đang gây nhiều tranh cãi về độ tin cậy và độc lập. Đặc biệt trong các nền tảng yêu cầu tính chính xác và trung lập như Wikipedia, việc phát hiện bài viết do chatbot tạo ra là một thách thức thực sự. Tuy nhiên, các biên tập viên tại đây đã chỉ ra một loạt dấu hiệu để nhận biết rất để nhận ra văn bản do AI sinh ra.

Table of Contents

AI thường viết văn bản có tông giọng kích tính, ít tự nhiên

Trong những phân tích từ Wikipedia, một dấu hiệu rõ ràng nhất của bài viết do chatbot là giọng văn “quá trốn trình” và thường lặp đi lặp lại những câu nói nhấn mạnh mức độ quan trọng hay “tính lịch sử” của một vấn đề. Kiểu diễn đạt này đôi khi gắn liền hơn với một bài luận văn trung học hơn là một bài viết bách khoa.

AI cũng có xu hướng kết thúc các đoạn bằng những câu tổng kết quá gọn ghép hoặc ý kiến đánh giá, dẫn đến việc mất tính khách quan cần thiết. Ngoài ra, AI thường dùng các từ chuyên dụng như “moreover”, “furthermore”, hay “in addition” một cách lặp lại, khiến bài viết trở nên không tự nhiên như con người viết thật. Câu trúc văn bản vì thế dễ nhận ra đối với người có kinh nghiệm.

Cách định dạng và trích dẫn của chatbot dễ bị lộ

Không chỉ về nội dung, phần hình thức của văn bản AI cũng thường bị nhận diện do sai lệch chuẩn mực. Các đầu dò, danh sách có thể xuất hiện với ký tự lạ, đáng ngờ, hoặc được sắp xếp một cách không phù hợp với quy ước biên tập của Wikipedia. Tiêu đề mục lịn thường sử dụng Title Case, khác với kiểu viết thường thấy trong các mục bài do người viết.

Ngoài ra, chatbot thường lắm dụng kiểu in đậm vô tội vạ cho một số từ để tăng độ nhấn, nhưng thực tế không có lợi cho tổng thể bài viết. Các lỗi nhỏ như ngoặc kép bị sai, gạch nối (—) sử dụng dơ thành, hoặc thậm chí emoji len lỏ trong tiêu đề cũng được xem là “trứng phạt” khá để nhận ra. Thậm chí nhiều bài viết AI còn chèn thêm tuyên bố: “kiến thức được huấn luyện đến mốc năm 2023…”, hoặc bỏ trống các đoạn cần điền như phiếu trắc nghiệm.

Khó chị trích dẫn cũng là dấu hiệu nhận biết. AI thường sản sinh các liên kết, số ISBN hoặc DOI không có thật, hoặc trích dẫn “chuyên gia” nhưng thực tế chẳng được nên tên trong toàn bài. Thậm chí, lỗi đối với Wikipedia là cách chatbot sử dụng sai các định dạng markup, category hay template của hệ thống. Tất nhiên, một hai dấu hiệu như trên chưa đủ để kết luận. Tuy nhiên, nếu một bài viết xuất hiện nhiều điểm nghi vào một lúc, thì rất có thể đó là sản phẩm từ chatbot.

AI thường viết văn bản có tông giọng kích tính, ít tự nhiên

Cách định dạng và trích dẫn của chatbot dễ bị lộ

Viết một bình luận Hủy