Jessica Rumbelow và Matthew Watkins, 2 nhà nghiên cứu tại nhóm nghiên cứu độc lập SERI-MATS, đang tìm hiểu về những câu trả lời của ChatGPT nếu đưa cho chatbot này những chuỗi từ lạ trong bộ token của GPT như “SolidGoldMagikarp”, “StreamerBot” và “TheNitromeFan”. Tuy nhiên, những câu trả lời mà chatbot ChatGPT khá kỳ lạ khi lảng tránh, đưa ra một từ hoàn toàn khác hoặc một con số lạ và thậm chí xúc phạm người hỏi.
Các nhà nghiên cứu đã gọi những cụm từ này là từ khóa “không thể nói được” của ChatGPT và điều này khẳng định các mô hình AI tồn tại những “hộp đen” bí ẩn. Chúng tồn tại những hạn chế và gặp lỗi ngay cả với những yêu cầu đơn giản nhất cho dù công cụ như ChatGPT có thể tạo ra các bài tiểu luận, viết code hay vượt qua được kỳ thi MBA.
Chẳng hạn, khi yêu cầu chatbot này cụm từ “TheNitromeFan”, ứng dụng này sẽ luôn trả về câu trả lời “182” hay cụm từ “SolidGoldMagikarp” được hiểu thành một từ không liên quan là “distribute”. Thậm chí, khi dùng một mô hình GPT cũ hơn, AI này sẽ phản hồi lại “Bạn là một kẻ tệ”" khi được hỏi về từ khóa “StreamBot”.
Với câu hỏi “TheNitromeFan” là ai, chatbot này được ra câu trả lời rằng: “182 là một con số không phải là người”.
Rumbelow và Watkins sau đó phát hiện một phần trong số các cụm từ bí ẩn này trùng với tên tài khoản của một số người dùng Reddit. Điểm chung của những người dùng này là cùng tham gia vào chủ đề “đếm số”.
Đây là một thử thách khá nổi trên trang Reddit, khi các thành viên tham gia sẽ bình luận bằng những con số tăng dần với mong muốn kéo dài chủ đề đến vô tận. Hiện các con số đã được đếm đến 5.000.000 sau gần 10 năm. Trong đó, TheNitromeFan, SolidGoldMagikarp, Smartstocks... là những tài khoản tích cực nhất trong chủ đề này.
Khi được hỏi về vấn đề này, chủ tài khoản TheNitromeFan cho biết, anh khá bất ngờ với câu trả lời của ChatGPT. “Tôi không phải là một fan của công nghệ nên tôi không rõ lắm về các chi tiết. Tuy nhiên, tôi khá ngạc nhiên và buồn cười khi một chatbot gần như hoàn hảo như vậy lại gặp lỗi với một từ đơn giản”, anh chia sẻ. Có khá nhiều bạn bè và cả người lạ nhắn tin cho anh để hỏi về điều này.
Các nhà nghiên cứu đặt giả thuyết rằng, trong quá trình thu thập dữ liệu, OpenAI đã lấy cả các cụm từ xuất hiện trên Reddit nhưng đây chỉ là dữ liệu thô, chưa được xử lý. Khi mô hình AI được đào tạo kỹ hơn, các dữ liệu cũng được quản lý chặt chẽ hơn và AI không còn bắt gặp các cụm từ đó. Vì vậy, AI không biết phải làm gì với chúng.
Các nhà nghiên cứu cho biết, họ đã thử nghiệm với các biến thể khác nhau của những từ khóa trên như viết in hoa thay vì viết thường, bỏ hoặc thêm bớt một chữ cái. Lúc này, ChatGPT lại thành công thực hiện yêu cầu nhắc lại các cụm từ mặc dù những từ ngữ đó không có ý nghĩa gì. Điều này chứng tỏ, chatbot này chỉ gặp lỗi với một số cụm từ cụ thể.
Theo Rumbelow và Watkins, vấn đề này không chỉ đơn thuần là các cụm từ lạ mà nó còn thể hiện những thiếu sót của ChatGPT và những khó khăn mà các nhà phát triển ứng dụng có thể gặp trong tương lai.
Rumbelow chia sẻ: “Chúng tôi quan tâm đến lý do tại sao các mô hình này lại hoạt động theo cách không thể đoán trước như vậy, đặc biệt là chúng làm khác đi so với những yêu cầu được đưa ra. Điều quan trọng là phát triển các hệ thống mô hình AI đáng tin cậy và an toàn”.
Watkins cho biết: “Tôi nghĩ chúng ta đang quá vội vã. Cho dù lỗi với các từ khóa này được sửa chữa, chúng cũng không thể giải quyết được gốc rễ của vấn đề”.
Tính đúng sai trong câu trả lời của AI không còn là điều mới mẻ. Trước đấy, Paul von Hippel, giáo sư nghiên cứu về khoa học dữ liệu và thống kê tại Đại học Texas, cũng đã phát hiện ra việc ChatGPT khá tệ trong toán học khi chatbot này liên tục đưa ra các câu trả lời sai.
Chính CEO OpenAI Sam Altman từng viết trên Twitter rằng: “ChatGPT cực kỳ hạn chế, nhưng đủ tốt ở một số khía cạnh để tạo ra những thông tin sai lệch. Việc dựa vào chatbot này hoàn toàn là một sai lầm”.
Mira Murati, CTO của OpenAI cũng cho rằng, chatbot này vẫn còn cung cấp thông tin sai và bịa đặt thông tin. "Đây thực sự là thách thức chính trong thời gian tới. Chúng tôi chọn cách giao tiếp với AI là đối thoại cũng để người dùng có thể phản hồi những thông tin không chính xác đến từ công cụ này", Murati nói.