นักวิจัยจากมหาวิทยาลัย Stanford พบว่าศาสตราจารย์ด้านกฎหมายชอบคำตอบด้านกฎหมายที่สร้างโดย AI มากกว่าคำตอบที่เขียนโดยเพื่อนร่วมสาขาเองราว 75% ของเวลาตามการศึกษาเมื่อไม่นานมานี้ ในการเปรียบเทียบแบบปกปิด 2,918 ครั้ง มีศาสตราจารย์ 16 คนจาก 14 สถาบันกฎหมายในสหรัฐฯ เลือกคำตอบของ Google Gemini 2.5 Pro 75.92% ของเวลา และเลือกคำตอบของ NotebookLM 74.75% ของเวลา มากกว่าคำตอบจากผู้สอนที่เป็นมนุษย์ การศึกษาทดสอบว่าระบบโมเดลภาษาขนาดใหญ่สามารถสอดคล้องกับมาตรฐานการให้เหตุผลทางกฎหมายแบบมืออาชีพได้หรือไม่ในมิติของหลักคำสอนทางกฎหมาย คำพิพากษา สถานการณ์สมมติ และประเด็นด้านนโยบาย ขณะที่โรงเรียนกฎหมายและศาลเริ่มผนวกรวมเครื่องมือ AI เข้ากับการปฏิบัติงานด้านกฎหมายมากขึ้น
การศึกษานี้มีศาสตราจารย์ 16 คนจาก 14 โรงเรียนกฎหมายในสหรัฐฯ รวมถึง Stanford, Yale, New York University, University of Chicago, Georgetown, UCLA และ University of Virginia ศาสตราจารย์สร้างคำถามเรื่องกฎหมายสัญญา 40 ข้อ ครอบคลุมหลักคำสอนทางกฎหมาย คำพิพษษา สถานการณ์สมมติ และประเด็นด้านนโยบาย นักวิจัยออกแบบการประเมินเพื่อทดสอบความสามารถของ AI ในโดเมนที่ต้องใช้การตัดสินใจ มากกว่าการมีคำตอบที่ถูกต้องเพียงคำตอบเดียว
“โมเดลภาษาขนาดใหญ่ (LLMs) ถูกโปรโมตมากขึ้นในฐานะติวเตอร์เพื่อการศึกษา แต่การประเมินส่วนใหญ่กลับเน้นโดเมนที่มี ‘คำตอบจริง’ เพียงคำตอบเดียว” นักวิจัยเขียน “อย่างไรก็ตาม หลายสาขาวิชาพึ่งพาการตัดสินใจ: การให้เหตุผล การชั่งน้ำหนักความคลุมเครือ และการได้ข้อสรุปที่สามารถปกป้องได้ กฎหมายจึงเป็นบททดสอบที่คมชัด”
ศาสตราจารย์ประเมินคู่คำตอบในการเปรียบเทียบแบบปกปิด โดยเลือกคำตอบที่ตนอยากให้แก่นักเรียนมากกว่าโดยไม่รู้ว่าคำตอบนั้นมาจาก AI หรือผู้สอนที่เป็นมนุษย์
Gemini 2.5 Pro ของ Google ชนะ 75.92% ของการแข่งขันเมื่อเทียบกับผู้สอนที่เป็นมนุษย์ ส่วน NotebookLM ชนะ 74.75% ของเวลา นักวิจัยวิเคราะห์ว่าผลลัพธ์สะท้อนฉันทามติแบบมืออาชีพที่กว้างขึ้นหรือไม่ ด้วยการดูอัตราความสอดคล้องเมื่อศาสตราจารย์ประเมินคู่คำตอบเดียวกัน
“ความสอดคล้องที่สังเกตได้สูงกว่าระดับที่คาดไว้ หากการตัดสินใจเป็นเรื่องเฉพาะตัวล้วนๆ ซึ่งบ่งชี้ว่าความสำเร็จของ LLM สะท้อนการสอดคล้องกับเกณฑ์ที่พบร่วมกันในสาขาวิชา” นักวิจัยเขียน
โมเดล AI ทำผลงานได้ดีกว่าผู้สอนที่เป็นมนุษย์ในหลายหมวดหมู่ รวมถึงคำถามด้านการระลึกข้อมูลที่เกี่ยวข้องกับคดี โค้ด หรือหลักคำสอน สถานการณ์สมมติ และการอภิปรายด้านนโยบาย การศึกษาทดสอบว่าแรงส่งของ AI มาจากรูปแบบการเขียนระดับผิวเผินหรือไม่ มากกว่าข้อมูลสาระสำคัญ โดยวิเคราะห์คุณลักษณะด้านเล็กซิโก-ซินแทกติก เช่น ความยาวของคำตอบ โครงสร้างเชิงองค์กร ความละเอียดอ่อนของการให้เหตุผล ข้ออ้างอิงทางกฎหมาย โทนความมั่นใจ ความชัดเจน และการสนับสนุนเชิงการสอน
ในการวิเคราะห์แยกของโมเดลเพิ่มเติม Anthropic's Claude Opus 4.7 อยู่อันดับ 1 ตามด้วย OpenAI's ChatGPT 5.4 และ Gemini 2.5 Pro โมเดล AI ทุกตัวที่ประเมินล้วนทำผลงานได้ดีกว่าผู้สอนที่เป็นมนุษย์โดยเฉลี่ย
คำตอบที่สร้างโดย AI ถูกระบุว่าเป็นอันตรายน้อยกว่าคำตอบที่เขียนโดยศาสตราจารย์ Gemini บันทึกอัตราความเป็นอันตราย 3.41% และ NotebookLM บันทึก 3.64% ขณะที่ผู้สอนที่เป็นมนุษย์อยู่ที่ 12.06%
นักวิจัยระบุว่าการศึกษาครั้งนี้ไม่ได้วัดว่าคำตอบตรงกับความชอบการสอนเฉพาะตัวของศาสตราจารย์แต่ละคนหรือไม่ “แม้ว่าโดยทั่วไปการตอบของ LLM มักเป็นที่ต้องการมากกว่าคำตอบของผู้สอนที่เป็นมนุษย์ แต่การตั้งค่าการประเมินของเราไม่เอื้อให้เราสามารถวัดโดยตรงได้ว่าความชอบของผู้สอนถูกตอบสนองมากน้อยเพียงใด” รายงานของการศึกษากล่าว “อย่างน้อยในเชิงทฤษฎี เป็นไปได้ว่าแม้ LLM จะส่งมอบคำตอบที่โดยรวม ‘ดีกว่า’ แต่ก็ยังสร้างคำตอบที่ถูกมองว่า ‘พอใช้ได้’ เท่านั้น”
ศาลแพ่งลอสแอนเจลิสเริ่มทดสอบเครื่องมือ AI ในเดือนมีนาคมเพื่อช่วยผู้พิพากษาจัดการภาระคดีที่เพิ่มขึ้น โรงเรียนกฎหมายกำลังเพิ่มโปรแกรมฝึกอบรม AI ขณะที่วิชาชีพด้านกฎหมายกำลังผนวกปัญญาประดิษฐ์เข้ากับงานมากขึ้น
“ประโยชน์ที่อาจเกิดขึ้นจากเทคโนโลยีใหม่เหล่านี้ในฐานะแรงทวีคูณในการปฏิบัติงานด้านกฎหมาย มันไม่สามารถมองข้ามได้จริง” John P. Anderson คณบดีคณะนิติศาสตร์ Mississippi College กล่าวกับ Decrypt “ไม่ว่าผู้เรียนของเราจะวางแผนเป็นทนายว่าคดีหรือทนายทำธุรกรรม นายจ้างในอนาคตจะคาดหวังความคุ้นเคยกับเครื่องมือ AI เหล่านี้ เราต้องการให้บริษัทที่จ้างนักศึกษาของเราเชื่อมั่นว่าเด็กจบ MC Law ทุกคนมีความสามารถด้านเทคโนโลยี AI”
บริษัทยังคงเผชิญคดีที่ถูกบั่นทอนด้วยภาพหลอนและความผิดพลาดอื่นๆ ที่สร้างโดย AI ในเดือนเมษายน บริษัทกฎหมาย Sullivan & Cromwell ยอมรับต่อศาลล้มละลายในสหรัฐฯ ว่าเอกสารยื่นล่าสุดในคดีที่เป็นที่จับตามองมีการอ้างอิงปลอมที่สร้างโดย AI
ในงานศึกษา Stanford ศาสตราจารย์ด้านกฎหมายชอบคำตอบที่สร้างโดย AI มากกว่าคำตอบที่เขียนโดยมนุษย์คิดเป็นกี่เปอร์เซ็นต์ของเวลา?
ศาสตราจารย์ด้านกฎหมายชอบคำตอบที่สร้างโดย AI ราว 75% ของเวลาตามการศึกษา Stanford โดย Gemini 2.5 Pro ของ Google ชนะ 75.92% ของการแข่งขันกับผู้สอนที่เป็นมนุษย์ ขณะที่ NotebookLM ชนะ 74.75% ของเวลาในการเปรียบเทียบแบบปกปิด 2,918 ครั้ง
อัตราความเป็นอันตรายของ AI เทียบกับคำตอบของผู้สอนที่เป็นมนุษย์อย่างไรในงานศึกษา?
คำตอบที่สร้างโดย AI มีอัตราความเป็นอันตรายต่ำกว่าคำตอบของผู้สอนที่เป็นมนุษย์ Gemini มีอัตราความเป็นอันตราย 3.41% และ NotebookLM มี 3.64% ขณะที่ผู้สอนที่เป็นมนุษย์อยู่ที่ 12.06%
ศาลแพ่งลอสแอนเจลิสกำลังทดสอบเครื่องมือ AI อะไร?
ศาลแพ่งลอสแอนเจลิสเริ่มทดสอบเครื่องมือ AI ในเดือนมีนาคมเพื่อช่วยผู้พิพากษาจัดการภาระคดีที่เพิ่มขึ้น แม้ว่าเครื่องมือเฉพาะที่ใช้ทดสอบไม่ได้ถูกระบุในแหล่งข้อมูลก็ตาม
news.related.news
ไมโครซอฟต์ Build เผยแพร่โมเดล AI จำนวน 7 รุ่น โดยใช้โทเคนน้อยกว่าคู่แข่ง 60%
Microsoft เปิดตัวโมเดล AI 7 รุ่น อ้างว่ามีความได้เปรียบเหนือ Claude และ Nano Banana
Alphabet เพิ่มทุน 80 พันล้าน ขยายโครงสร้างการคำนวณ AI นักลงทุน 100 พันล้านเข้าซื้อหุ้น Berkshire Hathaway
Alphabet แสวงหาเงิน 80 พันล้านดอลลาร์เพื่อขยายโครงสร้างพื้นฐานด้าน AI
วิกฤตต้นทุน AI กระตุ้นการเปรียบเทียบกับฟองสบู่ดอทคอมรอบใหม่