ข้อความข่าว Gate วันที่ 27 เมษายน — Logan Kilpatrick ผู้จัดการผลิตอาวุโสของ Google DeepMind และหัวหน้าฝ่ายผลิตภัณฑ์ของ Google AI Studio กล่าวบน X ว่าทุกบริษัทที่สร้างผลิตภัณฑ์ที่ขับเคลื่อนด้วย AI ควรจัดทำเกณฑ์มาตรฐานเฉพาะของตนเองเพื่อวัดประสิทธิภาพของโมเดล AI เขาอธิบายว่านี่เป็นวิธีเพื่อทำให้การปรับปรุงโมเดล "ส่งผลประโยชน์ต่อบริษัทของคุณอย่างไม่สมสัดส่วน" และกระตุ้นให้ผู้ก่อตั้งและผู้นำธุรกิจว่า "เริ่มพรุ่งนี้".

ปัจจุบันบริษัทส่วนใหญ่พึ่งพา leaderboard สาธารณะในการคัดเลือกโมเดล AI แต่สิ่งเหล่านี้วัดความสามารถทั่วไป ซึ่งมักไม่สอดคล้องกับสถานการณ์ทางธุรกิจเฉพาะทาง ตัวอย่างที่ Kilpatrick ยกคือบริษัทตรวจทานสัญญาที่ให้ความสำคัญกับความแม่นยำของการดึงอนุประโยค ซึ่งเป็นความสามารถที่ไม่ปรากฏอยู่ในเกณฑ์มาตรฐานสาธารณะ ทำให้ไม่สามารถประเมินประสิทธิภาพของโมเดลในงานนั้นได้ เกณฑ์มาตรฐานเฉพาะมีข้อได้เปรียบสำคัญสองประการ: ประการแรก ช่วยให้บริษัทสามารถประเมินการอัปเดตของแต่ละโมเดลเทียบกับงานทางธุรกิจของตน และเลือกโมเดลที่ทำได้ดีที่สุดในกรณีใช้งานจริง มากกว่าการเลือกโมเดลที่ติดอันดับสูงสุดโดยรวม; ประการที่สอง ช่วยให้บริษัทสามารถแบ่งปันชุดทดสอบเหล่านี้กับผู้ให้บริการโมเดล ซึ่งขับเคลื่อนการปรับปรุงและเพิ่มประสิทธิภาพอย่างต่อเนื่องในด้านที่สำคัญต่อธุรกิจของตน

Kilpatrick กล่าวว่าบริษัทอย่าง Zapier และ Sierra กำลังนำแนวทางนี้มาใช้แล้ว โดยระบุว่า "มีโอกาสสร้างสรรค์อัลฟาจำนวนมากที่สามารถเกิดขึ้นได้ที่นี่"

news.view.source

news.article.disclaimer

news.related.news

04-27 03:21

OpenAI จับมือกับ MediaTek และ Qualcomm เพื่อพัฒนาโปรเซสเซอร์สมาร์ทโฟนสำหรับ AI โดย Foxconn Connector จะเริ่มการผลิตในปี 2028

04-27 01:13

แซม อัลต์แมน เผยโครงร่างหลักการการดำเนินงาน 5 ประการของ OpenAI พร้อมส่งสัญญาณข้อจำกัดความสามารถของโมเดลที่อาจเกิดขึ้นในอนาคตเพื่อความปลอดภัย

04-24 12:21

Kaelan ผู้ร่วมก่อตั้ง NeoSoul: อุตสาหกรรม AI ควรเปิดพื้นที่ให้ของเล่นมีอยู่ นวัตกรรมมักเริ่มต้นจากผลิตภัณฑ์เชิงทดลอง

04-24 09:01

Xpeng, Xiaomi Lead In-Car AI Push at Beijing Auto Show