Trong thời đại công nghệ sinh học phát triển vượt bậc, giao tiếp não-máy tính (Brain-Computer Interface – BCI) đang nổi lên như một giải pháp đột phá cho những người bị liệt hoặc rối loạn vận động nghiêm trọng. Những cá nhân này thường mất khả năng nói chuyện, dẫn đến sự cô lập xã hội và giảm chất lượng cuộc sống. Theo các nghiên cứu gần đây, BCI có thể chuyển đổi tín hiệu não thành văn bản hoặc âm thanh, giúp họ giao tiếp tự nhiên hơn. Tuy nhiên, thách thức lớn là rủi ro giải mã những suy nghĩ không mong muốn, có thể xâm phạm quyền riêng tư. Một nghiên cứu mới từ Đại học Stanford, dẫn dắt bởi kỹ sư thần kinh Erin Kunz và các đồng nghiệp, đã khắc phục hạn chế này bằng cách tích hợp “mật khẩu” vào hệ thống BCI, cho phép người dùng kiểm soát quá trình giải mã. Nghiên cứu này không chỉ nâng cao độ chính xác mà còn đảm bảo an toàn, mở ra hy vọng cho hàng triệu người bị ảnh hưởng bởi các bệnh như ALS (xơ cứng teo cơ một bên) hoặc đột quỵ. Dựa trên bài báo gốc từ nature.com và các nguồn tiếng Anh khác, bài viết này sẽ mở rộng phân tích công nghệ BCI, phương pháp nghiên cứu, kết quả, và triển vọng tương lai.
BCI hoạt động bằng cách thu thập tín hiệu điện từ não bộ, thường qua các điện cực cấy ghép hoặc không xâm lấn, sau đó sử dụng trí tuệ nhân tạo (AI) để dịch chúng thành hành động hoặc lời nói. Lịch sử BCI bắt nguồn từ những năm 1970, với các thí nghiệm ban đầu sử dụng EEG (điện não đồ) để điều khiển con trỏ máy tính. Đến nay, các tiến bộ như Neuralink của Elon Musk đã cho phép cấy ghép không dây, ghi nhận hàng nghìn neuron cùng lúc. Trong lĩnh vực phục hồi lời nói, BCI đặc biệt hữu ích cho bệnh nhân bị “locked-in syndrome” – tình trạng nhận thức bình thường nhưng không thể cử động hoặc nói. Các nghiên cứu trước đây, như của Đại học California Davis, đã đạt độ chính xác 97% trong việc dịch tín hiệu não thành lời nói, sử dụng microelectrode arrays để ghi nhận hoạt động từ vỏ não vận động. Một ví dụ nổi bật là bệnh nhân ALS Casey Harrell, người có thể giao tiếp với tốc độ gần tự nhiên nhờ BCI, với lỗi từ chỉ 3% trên từ vựng 125.000 từ.
Nghiên cứu của Erin Kunz tập trung vào “lời nói nội tâm” (inner speech) – suy nghĩ không được thốt ra thành lời. Nhóm nghiên cứu phân tích tín hiệu não từ bốn người tham gia bị liệt nặng, sử dụng vi điện cực cấy vào vỏ não vận động – vùng kiểm soát vận động tự nguyện. Hình ảnh mặt cắt não từ chụp cộng hưởng từ (MRI) cho thấy lời nói nội tâm và lời nói thực tế xuất phát từ cùng vùng não, nhưng tín hiệu nội tâm yếu hơn. Dữ liệu này được dùng để huấn luyện mô hình AI nhận diện âm vị (phonemes) – đơn vị nhỏ nhất của lời nói. Sau đó, các mô hình ngôn ngữ lớn (large language models) ghép âm vị thành từ và câu thời gian thực, dựa trên từ vựng 125.000 từ. Kết quả ấn tượng: hệ thống giải mã chính xác 74% câu mà người tham gia tưởng tượng, chứng minh tính khả thi của việc decode inner speech mà không cần cử động miệng.
Để giải quyết rủi ro giải mã không mong muốn, nhóm thêm tính năng “mật khẩu”. Người dùng phải tưởng tượng một cụm từ hiếm như “Chitty-Chitty-Bang-Bang” hoặc “Orange you glad I didn’t say banana” để kích hoạt hệ thống. Điều này ngăn chặn việc vô tình đọc suy nghĩ riêng tư, nâng cao quyền riêng tư – một vấn đề lớn trong BCI. Nghiên cứu được công bố trên tạp chí Cell, với Erin Kunz và Benyamin Meschede-Krasa là đồng tác giả chính, dưới sự dẫn dắt của Frank Willett. So với các BCI trước, hệ thống này không chỉ chính xác hơn mà còn an toàn, đặc biệt cho inner speech, vốn khó phân biệt với suy nghĩ thông thường.
Mở rộng từ các nguồn khác, công nghệ BCI đã tiến bộ nhanh chóng. Tại UC Berkeley và UCSF, một BCI mới dịch não thành giọng nói tự nhiên thời gian thực, giảm độ trễ xuống dưới 1 giây, sử dụng AI để dự đoán âm thanh từ tín hiệu vận động. Nghiên cứu từ Nature năm 2023 cho thấy BCI đạt lỗi từ 9,1% trên từ vựng nhỏ và 23,8% trên từ vựng lớn, sử dụng spiking activity từ microelectrode. Các ứng dụng khác bao gồm kết hợp BCI với robot để phục hồi vận động, hoặc sử dụng cho bệnh Parkinson để dự đoán co giật. Tuy nhiên, thách thức vẫn tồn tại: điện cực cấy ghép có thể gây viêm não, pin hạn chế, và chi phí cao. Các nghiên cứu không xâm lấn như sử dụng fMRI hoặc EEG đang được phát triển để giảm rủi ro, dù độ chính xác thấp hơn.
Ngoài ra, tích hợp AI như deep learning và neural networks đã cải thiện tốc độ decode. Ví dụ, mô hình từ ScienceDirect sử dụng ECoG (electrocorticography) để tái tạo âm thanh từ tín hiệu não, đạt tốc độ gần thời gian thực. Tương lai, BCI có thể kết hợp với AR/VR để tạo giao tiếp ảo, hoặc sử dụng cho giáo dục và giải trí. Nhưng đạo đức là vấn đề lớn: ai kiểm soát dữ liệu não? Các tổ chức như NIH đang tài trợ nghiên cứu để đảm bảo an toàn và công bằng.
Nghiên cứu của Erin Kunz đánh dấu bước tiến quan trọng trong BCI, không chỉ phục hồi lời nói mà còn bảo vệ quyền riêng tư qua mật khẩu. Với độ chính xác cao và khả năng decode inner speech, công nghệ này hứa hẹn mang lại hy vọng cho bệnh nhân liệt, giúp họ tái hòa nhập xã hội. Kết hợp với các tiến bộ khác như từ UC Davis hay Neuralink, BCI đang tiến gần đến ứng dụng lâm sàng rộng rãi. Tuy nhiên, cần thêm nghiên cứu để giảm rủi ro và chi phí, đảm bảo lợi ích cho tất cả. Tương lai, BCI có thể thay đổi cách con người giao tiếp, mở ra kỷ nguyên mới trong y học thần kinh.
Nguồn: vista.gov.vn