Timnit Gebru ปฏิเสธไม่ถอนบทความ AI ที่ถูก Google ไล่ออก และหลังผ่านไป 5 ปี คำทำนาย 5 ข้อใหญ่ทำนายถูกทั้งหมด

GOOGLX-0.9%

谷歌開除Timnit Gebru

2020 年 12 月,Timnit Gebru(อดีตผู้ร่วมรับผิดชอบด้านจริยธรรม AI ของ Google)ระหว่างลาพักได้รับอีเมลแจ้งว่าเธอถูก Google เลิกจ้าง โดยสาเหตุคือ Google ขอให้เธอถอนการมีชื่อหรือเอาชื่อพนักงานออกจากบทความที่เธอเป็นผู้ร่วมเขียน แต่เธอไม่ยอมรับ ทำให้ในอีก 5 ปีถัดมา ประเด็นด้านภาพหลอนและการขาดความเข้าใจ การขยายอคติ ต้นทุนด้านสิ่งแวดล้อม ข้อมูลฝึกที่ตรวจสอบไม่ได้ และการรวมศูนย์ด้านภาษา ล้วนมีตัวอย่างให้พบในโลกจริง

ห้าคำทำนายเทียบกับความจริง: กรณีที่ยืนยันแล้วและข้อมูล

ภาพหลอนและการขาดความเข้าใจ:บทความในปี 2021 อธิบายปรากฏการณ์ที่ต่อมาถูกเรียกว่า “ภาพหลอน” โดยชี้ว่า LLM เพียงแค่ประกอบรูปแบบภาษาเข้าด้วยกันตามความน่าจะเป็น “โดยไม่มีการอ้างอิงถึงสิ่งที่มีความหมาย” ปัญหานี้กลายเป็นข้อบกพร่องที่เป็นที่รู้จักของระบบ AI กระแสหลักทั้งหมด และได้รับการยืนยันในบทวิจารณ์เชิงวิชาการหลายชิ้นที่ทำอย่างอิสระ

การขยายอคติ:เครื่องมือคัดเลือกพนักงานด้วย AI ของ Amazon ซึ่งพัฒนาตั้งแต่ปี 2014 ถูกยกเลิกในปี 2018 หลังพบว่ามีการเลือกปฏิบัติอย่างเป็นระบบต่อผู้สมัครผู้หญิง โดยโมเดลได้เรียนรู้มาตรฐานการประเมินที่เอนเอียงไปทางผู้ชายจากประวัติการจ้างงานในอดีตที่มีผู้ชายเป็นหลัก งานวิจัยของ Obermeyer และคณะ ในปี 2019 ที่ตีพิมพ์ในนิตยสาร Science เปิดเผยว่าอัลกอริทึมประเมินความเสี่ยงทางการแพทย์ที่ใช้กันอย่างแพร่หลายใช้ “ค่าใช้จ่ายด้านการแพทย์” แทน “ความรุนแรงของอาการ” ส่งผลให้ผู้ป่วยผิวดำที่มีคะแนนความเสี่ยงเท่ากันกลับมีความรุนแรงของอาการมากกว่า หลังการตรวจสอบ งานวิจัยยืนยันว่าหลังการปรับแก้ สัดส่วนผู้ป่วยผิวดำที่ถูกระบุว่าต้องได้รับการดูแลเพิ่มเติมจะเพิ่มจาก 17.7% เป็น 46.5%

ต้นทุนด้านสิ่งแวดล้อม:รายงานด้านสิ่งแวดล้อมของ Google ปี 2024 เปิดเผยว่าในปี 2023 การปล่อยก๊าซเรือนกระจกอยู่ที่ราว 14.30 ล้านตัน CO₂e เพิ่มขึ้น 48% จากฐานในปี 2019 สาเหตุหลักที่ Google ระบุคือการใช้ไฟฟ้าของศูนย์ข้อมูลที่เพิ่มขึ้นอย่างมากซึ่งได้รับแรงหนุนจาก AI ซึ่งคุกคามเป้าหมายความเป็นกลางทางคาร์บอนของ Google ที่ตั้งไว้สำหรับปี 2030 โดยตรง

ข้อมูลฝึกที่ตรวจสอบไม่ได้:ในเดือนธันวาคม 2023 สถานีสังเกตการณ์บนเว็บของ Stanford พบเนื้อหาแนวต้องสงสัยการล่วงละเมิดเด็ก (CSAM) จำนวน 3,226 รายการในชุดข้อมูล LAION-5B (ประกอบด้วยคู่รูป-ข้อความ 5.85 พันล้านคู่ ซึ่งเคยถูกใช้เพื่อฝึก Stable Diffusion) โดยในจำนวนดังกล่าว 1,008 รายการได้รับการยืนยันจากหน่วยงานภายนอก LAION-5B ถูกนำออกจากการให้บริการทันที

การรวมศูนย์ด้านภาษา:งานวิจัยของ Thompson และคณะ ในปี 2024 วิเคราะห์คลังข้อมูลภาษาบนเว็บที่ประกอบด้วย 6.38 พันล้านประโยค พบว่า 57.1% ของประโยคอยู่ในชุดคู่ขนานหลายภาษา ซึ่งมีแนวโน้มสูงว่าจะเป็นเนื้อหาซ้ำคุณภาพต่ำที่เกิดจากการแปลด้วยเครื่อง และสัดส่วนนี้ยิ่งสูงในภาษาแหล่งข้อมูลน้อย (low-resource languages) สะท้อนว่าคลังข้อมูลของภาษาแหล่งข้อมูลน้อยกำลังถูกปนเปื้อนด้วยผลผลิตคุณภาพต่ำจากการแปลด้วยเครื่อง

ข้อเท็จจริงที่ยืนยันได้เกี่ยวกับการถูกไล่ออกของ Gebru และบริบทของบทความ

บทความมีผู้เขียนทั้งหมด 6 คน โดย 4 คนเป็นพนักงานของ Google ขณะที่ Gebru ได้รับหนังสือแจ้งเลิกจ้าง เธอกำลังลาพัก Google ขอให้ถอนการมีชื่อหรือเอาชื่อพนักงานออกจากบทความ หลังจาก Gebru ปฏิเสธ เธอก็ได้รับแจ้งในช่วงลาพักว่ามีคำตัดสินเลิกจ้าง

บทความถูกตีพิมพ์อย่างเป็นทางการในเดือนมีนาคม 2021 บทความระบุชัดเจนว่า บริษัทที่พัฒนา LLM ไม่สามารถทำให้ “ความปลอดภัยและจริยธรรม” มาทำให้ความเร็วในการเปิดตัวผลิตภัณฑ์ช้าลงได้ในเชิงโครงสร้าง เหตุการณ์ที่ Gebru ถูกไล่ออกเองถูกยกมาอ้างอย่างกว้างขวางในฐานะหลักฐานเฉพาะของประเด็นเชิงโครงสร้างดังกล่าว

คำถามที่พบบ่อย

〈สุ่มนกแก้ว〉(Random Parrot) บทความ ข้ออ้างเชิงวิชาการหลักคืออะไร?

ตามตัวบทความ ประเด็นหลักมี 2 ชั้น ชั้นแรกเป็นเชิงเทคนิค โดยชี้ว่ามีความเสี่ยงเชิงระบบ 5 ประเภท ได้แก่ ภาพหลอน การขยายอคติ ต้นทุนด้านสิ่งแวดล้อม ข้อมูลตรวจสอบไม่ได้ และการรวมศูนย์ด้านภาษา ชั้นที่สองลึกกว่านั้น โดยชี้ว่าความเสี่ยงทั้ง 5 ประเภทนี้แก้ได้ยาก เพราะบริษัทที่พัฒนา LLM ภายใต้การแข่งขันและแรงกดดันทางการเงิน มีแนวโน้มเชิงโครงสร้างที่จะให้ “ความเร็ว” มาก่อน “ความปลอดภัย” บทความผ่านกระบวนการประเมินโดยผู้ทรงคุณวุฒิ (peer review) ในการประชุม ACM FAccT

ปัญหาเรื่องอคติในเครื่องมือคัดเลือกพนักงานด้วย AI ของ Amazon ถูกค้นพบและจัดการอย่างไร?

จากรายงานสาธารณะ เครื่องมือคัดเลือกพนักงานด้วย AI ของ Amazon เริ่มพัฒนาตั้งแต่ปี 2014 โดยโมเดลฝึกจากประวัติการจ้างงานในช่วง 10 ปีที่ผ่านมา ที่ผู้ชายมีสัดส่วนมากกว่า ทำให้โมเดลเรียนรู้รูปแบบการประเมินที่เอนเอียงไปทางผู้ชาย ส่งผลให้ประวัติที่มีคำอย่าง “women's chess club” ถูกหักคะแนนโดยอัตโนมัติ ปัญหาอคตินี้ถูกพบในปี 2018 จากนั้น Amazon จึงยกเลิกเครื่องมือนั้นทันที และยืนยันว่าไม่ได้ใช้มันในการประเมินผู้สมัครจริง

การเพิ่มขึ้นของการปล่อยคาร์บอนจากรายงานด้านสิ่งแวดล้อมของ Google ปี 2024 สามารถอธิบายได้อย่างเต็มที่ด้วย AI หรือไม่?

ตามรายงานด้านสิ่งแวดล้อมของ Google ปี 2024 การปล่อยก๊าซเรือนกระจกในปี 2023 อยู่ที่ราว 14.30 ล้านตัน CO₂e เพิ่มขึ้น 48% เมื่อเทียบกับฐานปี 2019 Google ระบุชัดเจนว่าเหตุผลหลักคือการใช้ไฟฟ้าของศูนย์ข้อมูลที่เพิ่มขึ้นอย่างมากซึ่งได้รับแรงหนุนจาก AI คำอธิบายของ Google ไม่ได้อ้างว่าการเพิ่มขึ้นของการปล่อยคาร์บอน 100% เกิดจาก AI แต่การขยายโครงสร้างพื้นฐานด้าน AI ได้รับการยืนยันว่าเป็นปัจจัยขับเคลื่อนที่สำคัญที่สุดที่ทำให้การเพิ่มขึ้นดังกล่าวเกิดขึ้น

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น