ข้อความข่าว Gate วันที่ 27 เมษายน — Logan Kilpatrick ผู้จัดการผลิตอาวุโสของ Google DeepMind และหัวหน้าฝ่ายผลิตภัณฑ์ของ Google AI Studio กล่าวบน X ว่าทุกบริษัทที่สร้างผลิตภัณฑ์ที่ขับเคลื่อนด้วย AI ควรจัดทำเกณฑ์มาตรฐานเฉพาะของตนเองเพื่อวัดประสิทธิภาพของโมเดล AI เขาอธิบายว่านี่เป็นวิธีเพื่อทำให้การปรับปรุงโมเดล “ส่งผลประโยชน์ต่อบริษัทของคุณอย่างไม่สมสัดส่วน” และกระตุ้นให้ผู้ก่อตั้งและผู้นำธุรกิจว่า “เริ่มพรุ่งนี้”.
ปัจจุบันบริษัทส่วนใหญ่พึ่งพา leaderboard สาธารณะในการคัดเลือกโมเดล AI แต่สิ่งเหล่านี้วัดความสามารถทั่วไป ซึ่งมักไม่สอดคล้องกับสถานการณ์ทางธุรกิจเฉพาะทาง ตัวอย่างที่ Kilpatrick ยกคือบริษัทตรวจทานสัญญาที่ให้ความสำคัญกับความแม่นยำของการดึงอนุประโยค ซึ่งเป็นความสามารถที่ไม่ปรากฏอยู่ในเกณฑ์มาตรฐานสาธารณะ ทำให้ไม่สามารถประเมินประสิทธิภาพของโมเดลในงานนั้นได้ เกณฑ์มาตรฐานเฉพาะมีข้อได้เปรียบสำคัญสองประการ: ประการแรก ช่วยให้บริษัทสามารถประเมินการอัปเดตของแต่ละโมเดลเทียบกับงานทางธุรกิจของตน และเลือกโมเดลที่ทำได้ดีที่สุดในกรณีใช้งานจริง มากกว่าการเลือกโมเดลที่ติดอันดับสูงสุดโดยรวม; ประการที่สอง ช่วยให้บริษัทสามารถแบ่งปันชุดทดสอบเหล่านี้กับผู้ให้บริการโมเดล ซึ่งขับเคลื่อนการปรับปรุงและเพิ่มประสิทธิภาพอย่างต่อเนื่องในด้านที่สำคัญต่อธุรกิจของตน
Kilpatrick กล่าวว่าบริษัทอย่าง Zapier และ Sierra กำลังนำแนวทางนี้มาใช้แล้ว โดยระบุว่า “มีโอกาสสร้างสรรค์อัลฟาจำนวนมากที่สามารถเกิดขึ้นได้ที่นี่”
news.related.news
MediaTek คว้าสัญญาใหญ่ Google TPU รุ่นที่ 8 แล้ว! การเร่งเครื่องสำหรับ ASIC ช่วยหนุนหุ้นกลุ่ม 3 ตัวในกลุ่มแนวคิดได้รับประโยชน์
JPMorgan: การโทเคไนซ์จะเปลี่ยนอุตสาหกรรมกองทุน แต่กรณีการใช้งานที่ “เหมาะสม” อาจต้องรออีกหลายปี
AI Agent สามารถสร้างซ้ำงานวิจัยทางวิชาการที่ซับซ้อนได้อย่างอิสระแล้ว: Mollick ระบุว่าข้อผิดพลาดส่วนใหญ่มาจากต้นฉบับของมนุษย์ ไม่ใช่จาก AI