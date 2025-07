Theo một nghiên cứu đăng trên tạp chí BMJ số ra Giáng sinh, hầu hết các mô hình ngôn ngữ lớn hay "chatbot" hàng đầu đều cho thấy dấu hiệu suy giảm nhận thức nhẹ trong các bài kiểm tra được sử dụng rộng rãi để phát hiện các dấu hiệu ban đầu của chứng mất trí.

Kết quả cũng cho thấy các phiên bản "cũ" của chatbot, giống như bệnh nhân lớn tuổi, có xu hướng hoạt động kém hơn trong các bài kiểm tra. Các tác giả cho biết những phát hiện này "thách thức giả định rằng trí tuệ nhân tạo sẽ sớm thay thế bác sĩ con người".

Bài kiểm tra bệnh nhân Alzheimer cho thấy các chatbot AI bị ...suy giảm nhận thức. Ảnh: AI Debuit

Những tiến bộ vượt bậc trong lĩnh vực trí tuệ nhân tạo đã dẫn đến một loạt suy đoán vừa phấn khích vừa lo sợ về việc liệu chatbot có thể vượt qua được bác sĩ con người hay không.

Một số nghiên cứu đã chỉ ra rằng các mô hình ngôn ngữ lớn (LLM) có khả năng đáng kinh ngạc trong nhiều nhiệm vụ chẩn đoán y khoa, nhưng khả năng chúng dễ bị suy giảm do con người như suy giảm nhận thức vẫn chưa được kiểm tra.

Để lấp đầy khoảng trống kiến thức này, các nhà nghiên cứu đã đánh giá khả năng nhận thức của các LLM hàng đầu, có sẵn công khai như ChatGPT phiên bản 4 và 4o (do OpenAI phát triển), Claude 3.5 "Sonnet" (do Anthropic phát triển) và Gemini phiên bản 1 và 1.5 (do Alphabet phát triển). Họ tiến hành bằng cách sử dụng bài kiểm tra Đánh giá nhận thức Montreal (MoCA).

Bài kiểm tra MoCA được sử dụng rộng rãi để phát hiện suy giảm nhận thức và các dấu hiệu sớm của chứng mất trí hoặc Alzheimer, thường ở người lớn tuổi.

Thông qua một số nhiệm vụ và câu hỏi ngắn, bài kiểm tra này đánh giá các khả năng bao gồm sự chú ý, trí nhớ, ngôn ngữ, kỹ năng thị giác không gian và chức năng điều hành. Điểm tối đa là 30 điểm, với điểm từ 26 trở lên thường được coi là bình thường.