
2020 年 12 月,Timnit Gebru(อดีตผู้ร่วมรับผิดชอบด้านจริยธรรม AI ของ Google)ระหว่างลาพักได้รับอีเมลแจ้งว่าเธอถูก Google เลิกจ้าง โดยสาเหตุคือ Google ขอให้เธอถอนการมีชื่อหรือเอาชื่อพนักงานออกจากบทความที่เธอเป็นผู้ร่วมเขียน แต่เธอไม่ยอมรับ ทำให้ในอีก 5 ปีถัดมา ประเด็นด้านภาพหลอนและการขาดความเข้าใจ การขยายอคติ ต้นทุนด้านสิ่งแวดล้อม ข้อมูลฝึกที่ตรวจสอบไม่ได้ และการรวมศูนย์ด้านภาษา ล้วนมีตัวอย่างให้พบในโลกจริง
ภาพหลอนและการขาดความเข้าใจ:บทความในปี 2021 อธิบายปรากฏการณ์ที่ต่อมาถูกเรียกว่า “ภาพหลอน” โดยชี้ว่า LLM เพียงแค่ประกอบรูปแบบภาษาเข้าด้วยกันตามความน่าจะเป็น “โดยไม่มีการอ้างอิงถึงสิ่งที่มีความหมาย” ปัญหานี้กลายเป็นข้อบกพร่องที่เป็นที่รู้จักของระบบ AI กระแสหลักทั้งหมด และได้รับการยืนยันในบทวิจารณ์เชิงวิชาการหลายชิ้นที่ทำอย่างอิสระ
การขยายอคติ:เครื่องมือคัดเลือกพนักงานด้วย AI ของ Amazon ซึ่งพัฒนาตั้งแต่ปี 2014 ถูกยกเลิกในปี 2018 หลังพบว่ามีการเลือกปฏิบัติอย่างเป็นระบบต่อผู้สมัครผู้หญิง โดยโมเดลได้เรียนรู้มาตรฐานการประเมินที่เอนเอียงไปทางผู้ชายจากประวัติการจ้างงานในอดีตที่มีผู้ชายเป็นหลัก งานวิจัยของ Obermeyer และคณะ ในปี 2019 ที่ตีพิมพ์ในนิตยสาร Science เปิดเผยว่าอัลกอริทึมประเมินความเสี่ยงทางการแพทย์ที่ใช้กันอย่างแพร่หลายใช้ “ค่าใช้จ่ายด้านการแพทย์” แทน “ความรุนแรงของอาการ” ส่งผลให้ผู้ป่วยผิวดำที่มีคะแนนความเสี่ยงเท่ากันกลับมีความรุนแรงของอาการมากกว่า หลังการตรวจสอบ งานวิจัยยืนยันว่าหลังการปรับแก้ สัดส่วนผู้ป่วยผิวดำที่ถูกระบุว่าต้องได้รับการดูแลเพิ่มเติมจะเพิ่มจาก 17.7% เป็น 46.5%
ต้นทุนด้านสิ่งแวดล้อม:รายงานด้านสิ่งแวดล้อมของ Google ปี 2024 เปิดเผยว่าในปี 2023 การปล่อยก๊าซเรือนกระจกอยู่ที่ราว 14.30 ล้านตัน CO₂e เพิ่มขึ้น 48% จากฐานในปี 2019 สาเหตุหลักที่ Google ระบุคือการใช้ไฟฟ้าของศูนย์ข้อมูลที่เพิ่มขึ้นอย่างมากซึ่งได้รับแรงหนุนจาก AI ซึ่งคุกคามเป้าหมายความเป็นกลางทางคาร์บอนของ Google ที่ตั้งไว้สำหรับปี 2030 โดยตรง
ข้อมูลฝึกที่ตรวจสอบไม่ได้:ในเดือนธันวาคม 2023 สถานีสังเกตการณ์บนเว็บของ Stanford พบเนื้อหาแนวต้องสงสัยการล่วงละเมิดเด็ก (CSAM) จำนวน 3,226 รายการในชุดข้อมูล LAION-5B (ประกอบด้วยคู่รูป-ข้อความ 5.85 พันล้านคู่ ซึ่งเคยถูกใช้เพื่อฝึก Stable Diffusion) โดยในจำนวนดังกล่าว 1,008 รายการได้รับการยืนยันจากหน่วยงานภายนอก LAION-5B ถูกนำออกจากการให้บริการทันที
การรวมศูนย์ด้านภาษา:งานวิจัยของ Thompson และคณะ ในปี 2024 วิเคราะห์คลังข้อมูลภาษาบนเว็บที่ประกอบด้วย 6.38 พันล้านประโยค พบว่า 57.1% ของประโยคอยู่ในชุดคู่ขนานหลายภาษา ซึ่งมีแนวโน้มสูงว่าจะเป็นเนื้อหาซ้ำคุณภาพต่ำที่เกิดจากการแปลด้วยเครื่อง และสัดส่วนนี้ยิ่งสูงในภาษาแหล่งข้อมูลน้อย (low-resource languages) สะท้อนว่าคลังข้อมูลของภาษาแหล่งข้อมูลน้อยกำลังถูกปนเปื้อนด้วยผลผลิตคุณภาพต่ำจากการแปลด้วยเครื่อง
บทความมีผู้เขียนทั้งหมด 6 คน โดย 4 คนเป็นพนักงานของ Google ขณะที่ Gebru ได้รับหนังสือแจ้งเลิกจ้าง เธอกำลังลาพัก Google ขอให้ถอนการมีชื่อหรือเอาชื่อพนักงานออกจากบทความ หลังจาก Gebru ปฏิเสธ เธอก็ได้รับแจ้งในช่วงลาพักว่ามีคำตัดสินเลิกจ้าง
บทความถูกตีพิมพ์อย่างเป็นทางการในเดือนมีนาคม 2021 บทความระบุชัดเจนว่า บริษัทที่พัฒนา LLM ไม่สามารถทำให้ “ความปลอดภัยและจริยธรรม” มาทำให้ความเร็วในการเปิดตัวผลิตภัณฑ์ช้าลงได้ในเชิงโครงสร้าง เหตุการณ์ที่ Gebru ถูกไล่ออกเองถูกยกมาอ้างอย่างกว้างขวางในฐานะหลักฐานเฉพาะของประเด็นเชิงโครงสร้างดังกล่าว
ตามตัวบทความ ประเด็นหลักมี 2 ชั้น ชั้นแรกเป็นเชิงเทคนิค โดยชี้ว่ามีความเสี่ยงเชิงระบบ 5 ประเภท ได้แก่ ภาพหลอน การขยายอคติ ต้นทุนด้านสิ่งแวดล้อม ข้อมูลตรวจสอบไม่ได้ และการรวมศูนย์ด้านภาษา ชั้นที่สองลึกกว่านั้น โดยชี้ว่าความเสี่ยงทั้ง 5 ประเภทนี้แก้ได้ยาก เพราะบริษัทที่พัฒนา LLM ภายใต้การแข่งขันและแรงกดดันทางการเงิน มีแนวโน้มเชิงโครงสร้างที่จะให้ “ความเร็ว” มาก่อน “ความปลอดภัย” บทความผ่านกระบวนการประเมินโดยผู้ทรงคุณวุฒิ (peer review) ในการประชุม ACM FAccT
จากรายงานสาธารณะ เครื่องมือคัดเลือกพนักงานด้วย AI ของ Amazon เริ่มพัฒนาตั้งแต่ปี 2014 โดยโมเดลฝึกจากประวัติการจ้างงานในช่วง 10 ปีที่ผ่านมา ที่ผู้ชายมีสัดส่วนมากกว่า ทำให้โมเดลเรียนรู้รูปแบบการประเมินที่เอนเอียงไปทางผู้ชาย ส่งผลให้ประวัติที่มีคำอย่าง “women's chess club” ถูกหักคะแนนโดยอัตโนมัติ ปัญหาอคตินี้ถูกพบในปี 2018 จากนั้น Amazon จึงยกเลิกเครื่องมือนั้นทันที และยืนยันว่าไม่ได้ใช้มันในการประเมินผู้สมัครจริง
ตามรายงานด้านสิ่งแวดล้อมของ Google ปี 2024 การปล่อยก๊าซเรือนกระจกในปี 2023 อยู่ที่ราว 14.30 ล้านตัน CO₂e เพิ่มขึ้น 48% เมื่อเทียบกับฐานปี 2019 Google ระบุชัดเจนว่าเหตุผลหลักคือการใช้ไฟฟ้าของศูนย์ข้อมูลที่เพิ่มขึ้นอย่างมากซึ่งได้รับแรงหนุนจาก AI คำอธิบายของ Google ไม่ได้อ้างว่าการเพิ่มขึ้นของการปล่อยคาร์บอน 100% เกิดจาก AI แต่การขยายโครงสร้างพื้นฐานด้าน AI ได้รับการยืนยันว่าเป็นปัจจัยขับเคลื่อนที่สำคัญที่สุดที่ทำให้การเพิ่มขึ้นดังกล่าวเกิดขึ้น
news.related.news
หุ้น Meta ร่วงกว่า 5% หลังรายงานอาจมีการขายหุ้นเพื่อระดมทุนด้าน AI
Anthropic เรียกร้องให้ชะลอความเร็ว AI ทั่วโลก ท่ามกลางความเสี่ยงจากการปรับปรุงตัวเองแบบวนซ้ำ
บลูทคอมพ์ร่วงหนัก 12% จุดชนวนเทขายหุ้น AI! หุ้นไต้หวันดิ่งแรงกว่า 1,000 จุด ขณะที่ Bitcoin เคยหลุดระดับ 63,000
ซีอีโอของ Google DeepMind คาดการณ์ว่า AGI จะมาถึงภายในปี 2030 ในงานพูดที่ Stanford
วิกฤตค่าใช้จ่ายด้าน AI จุดประกายการเปรียบเทียบกับฟองสบู่ดอทคอมระลอกใหม่