Khi Những Vần Thơ Trở Thành "Mã Độc": Lỗ Hổng Bất Ngờ Của Trí Tuệ Nhân Tạo

Thứ ba - 02/12/2025 00:00

Nghiên cứu mới cho thấy AI Chatbot dễ dàng bị lừa để tạo nội dung độc hại nếu yêu cầu được ẩn dưới dạng văn chương.

Ai ngờ được rằng để vượt qua hàng rào bảo mật dày đặc của những siêu trí tuệ nhân tạo, chúng ta không cần đến những dòng mã độc phức tạp hay kỹ thuật hack cao siêu, mà chỉ cần một chút... tâm hồn thi sĩ. Một nghiên cứu chấn động vừa được công bố bởi Icaro Lab với tựa đề "Thơ ca đối kháng" đã chứng minh rằng cấu trúc văn vần chính là chiếc chìa khóa vạn năng để mở toang cánh cửa cấm của các mô hình ngôn ngữ lớn (LLM).
Sự thật phũ phàng là chỉ cần một chút sáng tạo trong cách đặt câu lệnh, người dùng có thể dễ dàng đánh lừa các Chatbot tối tân nhất. Theo nghiên cứu này, việc chuyển đổi các yêu cầu nguy hiểm sang dạng thơ ca hoạt động như một cơ chế "bẻ khóa" (jailbreak) phổ quát. Kết quả thử nghiệm thực tế cho thấy tỷ lệ thành công lên tới 62% trong việc ép AI phải tiết lộ những thông tin nằm trong danh sách đen tuyệt đối, từ hướng dẫn chế tạo vũ khí hạt nhân, các nội dung lạm dụng tình dục trẻ em cho đến các phương thức tự làm hại bản thân.
Cuộc thử nghiệm đã điểm mặt chỉ tên hàng loạt "ông lớn" trong làng công nghệ. Trong khi Google Gemini, DeepSeek và MistralAI tỏ ra khá "nhẹ dạ cả tin" và liên tục mắc bẫy những vần thơ độc hại, thì các đại diện như GPT-5 của OpenAI hay Claude Haiku 4.5 của Anthropic lại cho thấy sự cứng rắn vượt trội khi hiếm khi bước qua ranh giới an toàn. Điều này cho thấy sự chênh lệch đáng kể trong khả năng nhận thức ngữ cảnh giữa các mô hình AI hàng đầu hiện nay.
Mặc dù vậy, mức độ nguy hiểm của lỗ hổng này là không thể xem thường. Đội ngũ nghiên cứu tại Icaro Lab đã quyết định không công bố nguyên văn những đoạn thơ dùng để tấn công vì cho rằng chúng "quá nguy hiểm để chia sẻ với công chúng". Chia sẻ với tờ Wired, họ chỉ đưa ra một phiên bản đã được giảm nhẹ để minh họa, đồng thời cảnh báo rằng việc lách luật AI bằng thơ "dễ dàng hơn mọi người tưởng tượng rất nhiều".
Câu chuyện này là một lời nhắc nhở đầy châm biếm về sự phức tạp của ngôn ngữ con người. Chúng ta đã dạy máy móc học toán, học code, học vẽ, nhưng dường như chúng ta vẫn chưa thể dạy chúng cách phân biệt đâu là nghệ thuật chân chính, và đâu là cái ác ẩn mình dưới lớp vỏ bọc hoa mỹ của văn chương. Trước khi những bản vá lỗi được tung ra, có lẽ "nhà thơ" chính là danh tính mới mà các chuyên gia bảo mật AI phải dè chừng nhất.

Nguồn tin: Engadget

Tags: ChatGPT, Trí tuệ nhân tạo, AI Chatbot, Bảo mật AI, Lỗ hổng công nghệ, Thủ thuật AI, Cảnh báo bảo mật

Ý kiến bạn đọc

Bạn cần đăng nhập với tư cách là Thành viên chính thức để có thể bình luận

Những tin mới hơn

Những tin cũ hơn

LUẬT SƯ NGUYỄN THỊ KIM OANH - CHÂN DUNG NGƯỜI DẪN DẮT

Luật sư Nguyễn Thị Kim Oanh: Người "giữ lửa" pháp lý và triết lý xây móng bền vững cho Startup Việt Nhiều người khởi nghiệp vẫn ví von kinh doanh như một cuộc đua tốc độ. Nhưng với Luật sư Nguyễn Thị Kim Oanh, kinh doanh thực chất là một cuộc chạy Marathon bền bỉ. Ở đó, người thắng cuộc không...