คณะแพทยศาสตร์ฮาร์วาร์ดได้ตีพิมพ์งานวิจัยล่าสุดในวารสาร Science เกี่ยวกับประสิทธิภาพของโมเดลภาษาขนาดใหญ่ในการวินิจฉัยทางการแพทย์ โดยงานวิจัยดังกล่าวใช้การทดสอบแบบปกปิดสองชั้นอย่างเข้มงวดและการประเมินการใช้เหตุผลทางคลินิก เพื่อเปรียบเทียบอย่างเป็นกลางถึงความแตกต่างในการอ่านและตีความเวชระเบียนระหว่างระบบ AI กับแพทย์มนุษย์ ผลลัพธ์ชี้ว่าโมเดล AI รุ่นใหม่สามารถจัดการข้อมูลทางคลินิกที่ซับซ้อนได้ดีกว่า โดยเฉพาะในสภาพแวดล้อมห้องฉุกเฉินที่มีความกดดันสูงและข้อมูลหนาแน่น อย่างไรก็ตาม นักวิจัยยังย้ำว่าผลการศึกษาของพวกเขาไม่ได้หมายความว่าระบบปัญญาประดิษฐิพร้อมสำหรับการรักษาและตัดสินใจด้วยตนเองแล้ว และไม่ได้หมายความว่าแพทย์จะถูกตัดออกจากกระบวนการวินิจฉัย
AI เหนือกว่าที่จุดตัดสินใจระยะแรกในห้องฉุกเฉิน
ทีมวิจัยให้โมเดล LLM ประเมินผู้ป่วยในสภาพแวดล้อมห้องฉุกเฉินมาตรฐาน โดยครอบคลุมตั้งแต่ช่วงการคัดแยกผู้ป่วยระยะแรก ไปจนถึงการตัดสินใจรับไว้รักษาในระยะหลัง ในแต่ละช่วง โมเดลจะได้รับเฉพาะข้อมูลที่มีอยู่ในเวลานั้นเท่านั้น—ข้อมูลเหล่านี้มาจากเวชระเบียนอิเล็กทรอนิกส์จริงโดยตรง—และได้รับมอบหมายให้สร้างผลการวินิจฉัยที่เป็นไปได้ พร้อมทั้งเสนอคำแนะนำสำหรับขั้นตอนการรักษาถัดไป สำหรับจุดตัดสินใจระยะแรกในเคสห้องฉุกเฉินในโลกความเป็นจริง โมเดลมีความแม่นยำในการวินิจฉัยเทียบเท่าหรือดีกว่าแพทย์ผู้รักษาหลัก และผลลัพธ์ดังกล่าวถึงขั้นทำให้นักวิจัยเองยังรู้สึกประหลาดใจ
งานวิจัยเน้นย้ำ: AI ยังไม่สามารถประกอบวิชาชีพแพทย์ด้วยตนเองได้ บทบาทของแพทย์ยังสำคัญ
อย่างไรก็ตาม นักวิจัยย้ำว่าผลการศึกษาของพวกเขาไม่ได้หมายความว่าระบบปัญญาประดิษฐิพร้อมสำหรับการรักษาและตัดสินใจด้วยตนเอง และไม่ได้หมายความว่าแพทย์จะถูกตัดออกจากกระบวนการวินิจฉัย
รายงานยังระบุด้วยว่าความก้าวหน้าอย่างรวดเร็วของ AI มีความหมายสำคัญต่อทั้งวิทยาศาสตร์และการปฏิบัติในเวชศาสตร์ แม้การนำ AI ไปใช้สนับสนุนการตัดสินใจทางคลินิกอาจถูกมองว่าเป็นมาตรการที่มีความเสี่ยงสูง แต่การใช้เครื่องมือเหล่านี้อย่างกว้างขวางอาจช่วยลดความผิดพลาดในการวินิจฉัย การเกิดความล่าช้าในการเข้ารับการรักษา และต้นทุนด้านกำลังคนและเศรษฐกิจที่เกิดจากความยากลำบากในการเข้าถึงการรักษาได้
บทความนี้ ฮาร์วาร์ดคณะแพทยศาสตร์: งานวิจัยล่าสุดชี้ว่า การตัดสินใจวินิจฉัยของ AI ในห้องฉุกเฉินดีกว่าแพทย์มนุษย์ เผยแพร่ครั้งแรกใน 鏈新聞 ABMedia
news.related.news
คนงานชนะคดีแทนที่ด้วย AI แบบสร้างบรรทัดฐานในประเทศจีน
ศาลจีนมีคำพิพากษาใหม่ล่าสุด: เหตุผลทางกฎหมายที่ทำให้การทำงานอัตโนมัติด้วย AI ไม่ถือเป็นการเลิกจ้าง
หลังจาก HBM คอขวดหน่วยความจำสำหรับ AI คือ HBF หรือไม่? David Patterson ผู้ได้รับรางวัลทัวริง: การประมวลผลด้วยการอนุมานจะนิยามสถาปัตยกรรมการจัดเก็บใหม่
การวิเคราะห์ของ Berkeley GEPA: ให้ AI เรียนรู้ภารกิจใหม่ได้โดยไม่ต้องอัปเดตน้ำหนัก พร้อมลดต้นทุนการฝึกลง 35 เท่าเมื่อเทียบกับ RL
การประเมิน AISI: ความสามารถในการโจมตีบนโลกออนไลน์ของ GPT-5.5 เทียบเท่ากับ Anthropic Mythos