Meta AI แปลงความคิดเป็นข้อความมีความแม่นยำถึง 61% พร้อมปล่อยโค้ดโอเพนซอร์สพร้อมกัน

Meta สัปดาห์นี้เปิดตัว Brain2Qwerty v2 ซึ่งเป็นระบบอินเทอร์เฟซสมอง-คอมพิวเตอร์แบบไม่รุกล้ำ ที่ใช้เครื่องสแกน MEG (แมกนีโตเอนเซฟาโลกราฟี) แบบหมวกกันน็อคบันทึกกิจกรรมทางประสาท และใช้โมเดลการเรียนรู้เชิงลึกแบบ end-to-end ถอดรหัสข้อความเป้าหมายโดยตรง มีอัตราความแม่นยำระดับคำเฉลี่ย 61% Meta เปิดเผยซอร์สโค้ดและชุดข้อมูลพร้อมกัน ซึ่งเป็นส่วนหนึ่งของโครงการ Digital Brain Project และจัดตั้งกองทุนมูลค่า 5 ล้านดอลลาร์สหรัฐ

สถาปัตยกรรมของ Brain2Qwerty v2: ขนาดการฝึกอบรมและวิธีการถอดรหัสแบบ end-to-end

ระบบนี้ใช้โมเดลการเรียนรู้เชิงลึกแบบ end-to-end ถอดรหัสจากสัญญาณสมอง MEG ดั้งเดิมไปยังข้อความที่ส่งออก โดยไม่ต้องพึ่งพาขั้นตอนการประมวลผลกลางที่ออกแบบด้วยมือ ส่วนโมเดลภาษาขนาดใหญ่จะแก้ไขข้อผิดพลาดที่เกิดจากสัญญาณรบกวนตามบริบททางความหมายในภายหลัง

ขนาดข้อมูลการฝึกอบรม: ประมาณ 22,000 ประโยค จากอาสาสมัคร 9 คน แต่ละคนบันทึกข้อมูลประมาณ 10 ชั่วโมง Meta ระบุว่าอัตราความแม่นยำจะเพิ่มขึ้นอย่างต่อเนื่องตามปริมาณข้อมูลการฝึกอบรมที่มากขึ้น สำหรับการเปรียบเทียบทางเทคนิค เวอร์ชัน v1 ภายใต้เงื่อนไข MEG มีอัตราความผิดพลาดของอักขระ (CER) ประมาณ 32% หากเปลี่ยนเป็น EEG (อิเล็กโทรเอนเซฟาโลกราฟี) สำหรับงานเดียวกัน จะเพิ่มขึ้นเป็นประมาณ 67%

ข้อได้เปรียบทางเทคนิคของ MEG และข้อจำกัดของอุปกรณ์ที่มีอยู่

MEG ใช้เซ็นเซอร์ตัวนำยิ่งยวดตรวจจับสนามแม่เหล็กขนาดเล็กมากที่เกิดจากกิจกรรมของเซลล์ประสาท โดยสนามแม่เหล็กสามารถทะลุผ่านได้ดีกว่า EEG ทำให้สัญญาณค่อนข้างชัดเจน แต่อุปกรณ์สแกน MEG แบบหมวกกันน็อคมีราคาหลายล้านดอลลาร์สหรัฐ และต้องใช้สภาพแวดล้อมพิเศษที่ป้องกันสนามแม่เหล็กภายนอก ทำให้ถูกจำกัดอยู่ในห้องปฏิบัติการประสาทวิทยาศาสตร์มาเป็นเวลานาน ยังไม่เข้าสู่การใช้งานทางคลินิกหรือผู้บริโภค

Brain2Qwerty v2 ภายใต้ข้อจำกัดของอุปกรณ์นี้บรรลุความแม่นยำ 61% ซึ่งใกล้เคียงกับระดับที่เคยทำได้เฉพาะอินเทอร์เฟซแบบฝัง (เช่น Neuralink) เท่านั้น จุดเริ่มต้นที่ Meta เลือกเส้นทางแบบไม่รุกล้ำคือ: อุปสรรคในการผ่าตัดของอินเทอร์เฟซแบบฝังทำให้ผู้รับประโยชน์ที่มีศักยภาพส่วนใหญ่ยอมรับได้ยาก

แผนการเปิดซอร์สของ Meta: Digital Brain Project และกองทุน 5 ล้านดอลลาร์สหรัฐ

Meta เปิดเผยซอร์สโค้ดของระบบและชุดข้อมูลการฝึกอบรมพร้อมกันเมื่อเปิดตัว Brain2Qwerty v2 ซึ่งเป็นส่วนหนึ่งของโครงการ Digital Brain Project นอกจากนี้ Meta ยังจัดตั้งกองทุนมูลค่า 5 ล้านดอลลาร์สหรัฐ โดยเฉพาะเพื่อสนับสนุนการสร้างชุดข้อมูลประสาทวิทยาศาสตร์แบบเปิด

Meta ระบุว่าหนึ่งในอุปสรรคของการวิจัย BCI แบบไม่รุกล้ำคือการขาดชุดข้อมูลประสาทวิทยาศาสตร์ขนาดใหญ่ที่เปิดเผยต่อสาธารณะ ในปัจจุบันสถาบันวิจัยต่างๆ เก็บรวบรวมข้อมูลพื้นฐานซ้ำซ้อนอย่างมีประสิทธิภาพต่ำมาก กองทุนนี้มีเป้าหมายเพื่อผลักดันให้ชุมชนร่วมกันสร้างข้อมูล基准

คำถามที่พบบ่อย

ความแตกต่างทางเทคนิคหลักระหว่างอินเทอร์เฟซสมอง-คอมพิวเตอร์แบบไม่รุกล้ำและแบบฝังคืออะไร?

อินเทอร์เฟซแบบฝัง (เช่น Neuralink) ฝังอิเล็กโทรดโดยตรงในชั้นคอร์เทกซ์ของสมอง สัญญาณสะอาด หน่วงเวลาต่ำ ความแม่นยำสูง แต่ต้องผ่าตัด วิธีการแบบไม่รุกล้ำมีความท้าทายหลักคืออัตราส่วนสัญญาณต่อสัญญาณรบกวน: กะโหลกศีรษะและหนังศีรษะลดทอนสัญญาณอย่างรุนแรง โดยเฉพาะ EEG; MEG มีความสามารถในการทะลุผ่านค่อนข้างดีกว่า แต่ต้นทุนอุปกรณ์และข้อกำหนดด้านสิ่งแวดล้อมจำกัดการแพร่หลาย

โมเดล "end-to-end" ของ Brain2Qwerty v2 มีความสำคัญทางเทคนิคอย่างไร?

โมเดล end-to-end ถอดรหัสจากสัญญาณ MEG ดั้งเดิมไปยังข้อความที่ส่งออกโดยตรง โดยไม่ต้องให้นักวิจัยออกแบบขั้นตอนกลางด้วยตนเอง (เช่น ระบุเหตุการณ์คลื่นสมองเฉพาะก่อนแล้วค่อยอนุมานตัวอักษรทีละขั้น) Meta ยังใช้ AI agents ในการสำรวจพื้นที่การปรับปรุงกระบวนการถอดรหัสอย่างเป็นระบบในระหว่างการพัฒนา วิศวกรเลือกการกำหนดค่าการฝึกอบรมขั้นสุดท้ายจากนั้น

ระบบนี้จะเข้าสู่ตลาดทางคลินิกหรือเชิงพาณิชย์เมื่อใด?

Brain2Qwerty v2 ปัจจุบันทดสอบภายใต้เงื่อนไขอุปกรณ์ MEG ในห้องปฏิบัติการ เป็นระบบในขั้นตอนการวิจัย ยังไม่ได้เข้าสู่การทดลองทางคลินิกหรือกระบวนการเชิงพาณิชย์ Meta ระบุว่าอัตราความแม่นยำยังมีพื้นที่ให้ปรับปรุง แต่กำหนดการทางคลินิกหรือเชิงพาณิชย์ยังไม่ได้รับการเปิดเผย ณ เวลาที่รายงาน

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น