Meta tuần này phát hành Brain2Qwerty v2, một hệ thống giao diện não-máy tính không xâm lấn ghi lại hoạt động thần kinh qua máy quét MEG (từ não đồ) dạng mũ bảo hiểm, sử dụng mô hình học sâu đầu cuối để giải mã trực tiếp văn bản mục tiêu, với độ chính xác trung bình từ đạt 61%. Meta đồng thời mã nguồn mở dữ liệu và mã nguồn như một phần của Dự án Não Kỹ thuật số, đồng thời thành lập quỹ 5 triệu USD.
Hệ thống này sử dụng mô hình học sâu đầu cuối (end-to-end), giải mã trực tiếp từ tín hiệu MEG thô thành văn bản đầu ra, không phụ thuộc vào các bước xử lý trung gian thủ công; mô hình ngôn ngữ lớn ở giai đoạn sau hiệu chỉnh lỗi do nhiễu dựa trên ngữ cảnh ngữ nghĩa.
Quy mô dữ liệu huấn luyện: khoảng 22.000 câu, 9 tình nguyện viên, mỗi người khoảng 10 giờ dữ liệu ghi. Meta cho biết độ chính xác sẽ tiếp tục tăng khi lượng dữ liệu huấn luyện tăng lên. Để đối chiếu kỹ thuật, phiên bản v1 có tỷ lệ lỗi ký tự (CER) khoảng 32% trong điều kiện MEG; khi thay bằng EEG, con số này tăng lên khoảng 67%.
MEG sử dụng cảm biến siêu dẫn để phát hiện từ trường cực nhỏ do hoạt động thần kinh tạo ra, khả năng xuyên thấu từ trường tốt hơn EEG, tín hiệu tương đối rõ ràng; nhưng mũ MEG có giá hàng trăm nghìn USD và yêu cầu môi trường cách ly từ trường đặc biệt, từ lâu chỉ giới hạn trong phòng thí nghiệm khoa học thần kinh, chưa đi vào ứng dụng lâm sàng hoặc tiêu dùng.
Brain2Qwerty v2 đạt độ chính xác 61% trong điều kiện hạn chế thiết bị này, tiếp cận mức độ trước đây chỉ có giao diện cấy ghép (như Neuralink) mới đạt được. Điểm xuất phát của Meta khi chọn hướng không xâm lấn là: rào cản phẫu thuật của giao diện cấy ghép khiến đa số người có tiềm năng hưởng lợi khó chấp nhận.
Khi phát hành Brain2Qwerty v2, Meta đồng thời công khai mã nguồn hệ thống và bộ dữ liệu huấn luyện như một phần của Dự án Não Kỹ thuật số. Meta cũng thành lập quỹ 5 triệu USD, chuyên dùng để hỗ trợ xây dựng bộ dữ liệu thần kinh mở.
Meta chỉ ra rằng một trong những nút thắt của nghiên cứu BCI không xâm lấn là thiếu bộ dữ liệu thần kinh quy mô lớn công khai; hiện nay các tổ chức nghiên cứu thu thập dữ liệu cơ bản lặp đi lặp lại với hiệu suất rất thấp; quỹ này nhằm thúc đẩy cộng đồng cùng xây dựng dữ liệu chuẩn.
Giao diện cấy ghép (như Neuralink) cấy điện cực trực tiếp vào vỏ não, tín hiệu sạch, độ trễ thấp, độ chính xác cao, nhưng cần phẫu thuật. Thách thức chính của phương pháp không xâm lấn là tỷ lệ tín hiệu/nhiễu: hộp sọ và da đầu làm suy giảm tín hiệu nghiêm trọng, đặc biệt là EEG; MEG có khả năng xuyên thấu tương đối tốt hơn, nhưng chi phí thiết bị và yêu cầu môi trường hạn chế khả năng phổ biến.
Mô hình đầu cuối giải mã trực tiếp từ tín hiệu MEG thô thành văn bản đầu ra, không cần nhà nghiên cứu thiết kế thủ công các bước trung gian (ví dụ: trước hết nhận diện các sự kiện não cụ thể rồi suy luận từng chữ cái). Trong quá trình phát triển, Meta đã sử dụng các tác nhân AI để khám phá một cách có hệ thống không gian tối ưu hóa của quy trình giải mã, từ đó các kỹ sư chọn ra cấu hình huấn luyện cuối cùng.
Brain2Qwerty v2 hiện đang được thử nghiệm trên thiết bị MEG trong phòng thí nghiệm, thuộc giai đoạn nghiên cứu, chưa đi vào thử nghiệm lâm sàng hoặc thương mại hóa. Meta cho biết độ chính xác vẫn còn dư địa cải thiện, nhưng thời gian lâm sàng hoặc thương mại hóa tính đến thời điểm báo cáo chưa được công bố.
Tin tức liên quan
OpenAI công bố ra mắt bàn phím macro Codex, phát hành vào ngày 15 tháng 7.
Micron Q3 doanh thu tăng 346%, tình trạng thiếu bộ nhớ kéo dài đến năm 2028
Lỗ hổng hạn mức Codex lại gây sự cố, OpenAI tiến hành hard reset lần thứ hai
Nhà nghiên cứu Microsoft công bố bài báo: Nếu ChatGPT có ý thức, thì con dê trong 《Age of Empires 2》 cũng có.