หัวหน้า AI ของ Tencent หยวน ซุ่นหยู ปกป้องจังหวะการพัฒนาในการประชุมวันที่ 5 มิถุนายน

เฉินเหว่ยเค่อ นักวิทยาศาสตร์ AI หัวหน้าของ Tencent เดินทางมาปรากฏตัวต่อสาธารณะครั้งแรกในวันที่ 5 มิถุนายน ที่งาน Tencent Cloud AI Industry Application Conference โดยได้พูดคุยถึงโมเดลภาษาขนาดใหญ่ Hunyuan 3 ของบริษัท และตอบข้อวิจารณ์ที่ว่า Tencent ตามหลังด้านการพัฒนา AI Yao วัย 28 ปี ซึ่งเข้าร่วม Tencent จาก OpenAI และเป็นผู้นำทีมโมเดล Hunyuan ได้ร่วมสนทนากับ Tang Daosheng รองประธานบริหารอาวุโสของ Tencent ครอบคลุมกลยุทธ์โมเดล AI การพัฒนาผลิตภัณฑ์ และอนาคตของเอเจนต์อัจฉริยะ Yao ตอบคำสงสัยจากภายนอกโดยอธิบายการแข่งขันด้าน AI ว่าเป็นการแข่งขันระยะยาวแบบมาราธอน ไม่ใช่สปรินต์ และกล่าวว่าโลกไม่สามารถพึ่งพา ChatGPT เพียงแอปพลิเคชันเด่นเพียงตัวเดียวได้

Yao Shunyu เผยรายละเอียดแนวทางพัฒนา Hunyuan 3

Yao อธิบายการปรับปรุงหลัก 3 ด้านของ Hunyuan 3 ในระหว่างการสนทนาภายในงาน “จริงๆ แล้วไม่มีความลับ การสร้างโมเดลขนาดใหญ่ในปัจจุบันในระดับหนึ่งเป็นงานที่ค่อนข้างน่าเบื่อ เราควรโฟกัสให้โครงสร้างพื้นฐานถูกต้อง ให้ข้อมูลถูกต้อง — ส่วนด้านอัลกอริทึมค่อนข้างง่าย” Yao กล่าว การปรับปรุงดังกล่าวได้แก่ การสร้างโครงสร้างพื้นฐานใหม่ทั้งหมดสำหรับการพรีเทรนและการเรียนรู้แบบเสริมกำลัง การอัปเกรดระบบข้อมูลและระบบการประเมินอย่างครอบคลุม โดยให้ความสำคัญมากขึ้นกับการนิยามปัญหาจริง และการยกระดับคุณภาพข้อมูล รวมถึงการตัดสินใจโดยอาศัย “รสนิยม” ในด้านการจ้างงาน จังหวะการพัฒนาโมเดล และการแลกเปลี่ยน (tradeoffs)

Yao ซึ่งเสนอสถาปัตยกรรม ReAct ในงานวิจัยระดับปริญญาเอกของเขา เน้นว่าในการพัฒนาโมเดลจำนวนมาก การตัดสินใจเป็น “รสนิยมขับเคลื่อน” มากกว่าการยึดตามสูตร “การตัดสินใจจำนวนมากจริงๆ แล้วขับเคลื่อนด้วยรสนิยม” เขาย้ำหลายครั้งในระหว่างการสนทนา วิทยานิพนธ์ระดับปริญญาเอกของเขาในปี 2019 หัวข้อ “From Next Token Prediction to Digital Automation” ได้สำรวจเอเจนต์ด้านภาษาในยุค GPT-2 “ตอนนั้นยังเป็นยุค GPT-2 และมันยังไม่สามารถสร้างย่อหน้าแบบต่อเนื่องได้—มีจุดหยาบๆ มากมาย” Yao ย้อนความ “แต่ผมรู้สึกในตอนนั้นว่า GPT เป็นสิ่งที่ดูสง่างามมาก และการสร้างโทเค็นถัดไปคือภารกิจที่เรียบง่ายอย่างยิ่งแต่กว้างมาก ผมเชื่อว่ามันมีศักยภาพในสักวันหนึ่งไม่เพียงแค่สร้างโทเค็นถัดไป แต่ยังช่วยทำให้ทุกอย่างในโลกนี้เป็นแบบอัตโนมัติได้”

Yao ระบุว่าเอเจนต์ด้านการเขียนโค้ดคือรูปแบบที่จำเป็นที่สุดของเอเจนต์อัจฉริยะ เพราะมันเป็น Turing-complete เขาแจกแจงกลยุทธ์ 3 ส่วนของ Tencent สำหรับการพัฒนาเอเจนต์ ได้แก่ การเน้นการออกแบบระบบอย่างครบถ้วน การใช้ข้อมูลที่ไหลย้อนกลับมาจากสายผลิตภัณฑ์อย่างเต็มที่ และการรักษาจินตนาการที่เพียงพอสำหรับการสำรวจ ในด้านกลยุทธ์การพัฒนาโมเดล Yao เปิดเผย 3 แนวทาง ได้แก่ การคงระบบข้อมูลแบบครบวงจรแม้การเขียนโค้ดจะกลายเป็นแทร็กที่สำคัญที่สุด การใช้ข้อมูลตอบกลับจากสายผลิตภัณฑ์ผ่านประสบการณ์การ co-design และการสำรวจแนวทางกระบวนทัศน์ถัดไปทั้งในด้านเทคโนโลยีและวิวัฒนาการของผลิตภัณฑ์

สำหรับการแลกเปลี่ยนด้านความคุ้มทุน Yao กล่าวว่า “ประสิทธิภาพ” เป็นเงื่อนไขเบื้องต้นของความคุ้มค่า “หลายคนมองว่าการใช้โมเดลที่แข็งแกร่งนั้นถูกกว่าการใช้โมเดลที่แย่ เพราะมันทำสิ่งต่างๆ ได้ถูกต้องเร็วกว่า” เขาอธิบาย เขาเสนอว่า “การทำให้ได้ประสิทธิภาพระดับแข็งแกร่งด้วยโมเดลที่ค่อนข้างเล็ก และการคงประสิทธิภาพที่แข็งแรงสำหรับงานส่วนใหญ่” อาจ “มีค่ามากกว่าในปัจจุบันของจีน”

Tencent กำหนดข้อกำหนดด้านองค์กรสำหรับ AGI

Yao เปิดตัวแนวคิด “ครึ่งหลังของ AI” ในบล็อกโพสต์เมื่อปีที่แล้ว ซึ่งปัจจุบันกลายเป็นคำที่ถูกใช้อย่างแพร่หลายภายในอุตสาหกรรม เขาอธิบายว่าแก่นของแนวคิดนี้คือการเปลี่ยนแปลงพื้นฐาน: ในขณะที่หลายทศวรรษก่อนการพัฒนา AI มุ่งเน้น “การหาวิธีการ” แต่เมื่อวิธีการได้เติบโตเป็นรูปเป็นร่างแล้ว “การหาปัญหาที่ดี” กลับยากขึ้น “ในอดีตเราประดิษฐ์วิธีการอย่าง AlphaGo เพื่อเล่นโก แต่ได้นำไปเล่นหมากรุกเท่านั้น เราทำโมเดลเฉพาะสำหรับการแปล แต่ทำได้แค่การแปล แต่ด้วยการพรีเทรนและโพสต์เทรน ตอนนี้เรามีค้อนอเนกประสงค์ที่สามารถงับตะปูได้ทุกแบบ” Yao อธิบาย “สิ่งที่ยากกว่าจริงๆ คือการหาปัญหาที่ดีที่จะไปแก้”

Yao กล่าวว่า พอร์ตผลิตภัณฑ์และสถานการณ์ที่หลากหลายมหาศาลของ Tencent ให้ “แหล่งที่มาของปัญหา” ที่แท้จริงสำหรับเทคโนโลยี AI ซึ่งเป็นเหตุผลประการที่สองที่ทำให้เขาเข้าร่วมบริษัท เขาระบุว่าวัฒนธรรมคือแรงจูงใจหลักของเขา “ตอนที่ผมคุยครั้งแรกกับประธาน Tang และผู้นำระดับบริหารคนอื่นๆ ความประทับใจแรกของผมคือ ทุกคนพูดตรงไปตรงมามากเกี่ยวกับสิ่งที่เราทำได้ดีและสิ่งที่เราทำได้ไม่ดี—ชัดเจนและไม่ปิดบัง” Yao กล่าว “ภาพรวมของ Tencent ดำเนินงานบนพื้นฐานของความไว้วางใจมากกว่าตัวชี้วัด วัฒนธรรมที่ซื่อสัตย์ถ่อมตัวและมีท่าทีเชิงปฏิบัติจริง พร้อมด้วยพันธสัญญาต่อแนวคิดมองไกลระยะยาว นี่คือสิ่งสำคัญสำหรับการสร้างองค์กร AI ระยะยาว”

ตามคำกล่าวของ Yao งานที่สำคัญที่สุดในครึ่งหลังของ AI คือการสร้างองค์กรระยะยาวบนฐาน AGI ในจีน องค์กรดังกล่าวต้องสร้าง “สามเหลี่ยมที่สมดุล”: เทคโนโลยีพื้นฐานที่แข็งแกร่ง ผลิตภัณฑ์ที่สร้างคุณค่า และจิตวิญญาณแห่งการสำรวจแนวหน้า

Yao และ Tang ตอบคำวิจารณ์เรื่องความเร็วในงานประชุม

Yao กล่าวว่าในการสนทนาว่า AI คือเกมระยะยาว และครึ่งหลังเพิ่งเริ่มต้น “ผมไม่คิดว่า ChatGPT และ Claude Code จะเป็นซูเปอร์แอปพลิเคชันเพียงตัวเดียว—นั่นคงเป็นโลกที่น่าเศร้ามาก วันนี้เหมือนช่วงทศวรรษ 1970 ตอนที่พีซีเพิ่งเกิดขึ้น—ยังมีหลายๆ อย่างที่ต้องทำ” Yao กล่าว เขาคาดการณ์ว่าอนาคตจะมีความหลากหลายมากขึ้น ไม่ใช่รวมศูนย์มากขึ้น โดยระบุว่า “เอเจนต์ด้านการเขียนโค้ดเพิ่งเริ่มต้น และปัญญาแบบหลายโหมดที่มีตัวตน (multimodal, embodied intelligence)—สิ่งใหม่ๆ อีกมากมายกำลังเริ่มเกิดขึ้น”

“ในอดีต โมเดลและผลิตภัณฑ์ผ่านการสำรวจจำนวนมากและต้องอ้อมไปหลายทาง ผมคิดว่านั่นเป็นเรื่องปกติ” Yao ระบุ “สิ่งที่สำคัญกว่าคือเราสามารถเผชิญหน้ากับตัวเองอย่างจริงใจได้หรือไม่ เราสามารถเป็นจริงได้หรือไม่ เราสามารถมองเห็นฟีดแบ็กแล้วเปลี่ยนแปลงได้หรือไม่ และรักษาความอดทนไว้ได้หรือไม่ นี่คือสิ่งที่สำคัญที่สุดในครึ่งหลัง”

Tang Daosheng กล่าวว่า Tencent ยินดีต่อคำวิจารณ์และข้อเสนอจากภายนอก “เราเป็นบริษัทที่มีรูปแบบธุรกิจหลากหลายมาก บางครั้งเราอาจจะเร็ว บางครั้งอาจจะช้า และเราจะล้มเหลวในบางพื้นที่ แต่ทว่านี่คือมาราธอน และเรามองว่าโมเดลจะทำการปรับปรุงอย่างต่อเนื่อง ความต้องการของผู้ใช้งานจะยังคงเปลี่ยน และรูปแบบผลิตภัณฑ์ใหม่จะทยอยเกิดขึ้น” Tang กล่าว

FAQ

Yao Shunyu ประกาศอะไรในงาน Tencent วันที่ 5 มิถุนายน?

Yao Shunyu นักวิทยาศาสตร์ AI หัวหน้าของ Tencent ได้หารือถึงแนวทางการพัฒนาโมเดลภาษาขนาดใหญ่ Hunyuan 3 ในงาน Tencent Cloud AI Industry Application Conference วันที่ 5 มิถุนายน เขาอธิบายการปรับปรุงหลัก 3 ด้าน ได้แก่ การสร้างโครงสร้างพื้นฐานสำหรับพรีเทรนและการเรียนรู้แบบเสริมกำลังใหม่ การอัปเกรดระบบข้อมูลและระบบการประเมิน และการนำการตัดสินใจแบบขับเคลื่อนด้วยรสนิยมไปใช้ครอบคลุมทั้งการจ้างงานและการพัฒนาโมเดล Yao ยังตอบโต้คำวิจารณ์เกี่ยวกับความเร็วในการพัฒนา AI ของ Tencent โดยมองการแข่งขันเป็นมาราธอนมากกว่าสปรินต์

ทำไม Yao Shunyu ถึงเข้าร่วม Tencent จาก OpenAI?

Yao ระบุในการสนทนาภายในงานว่าความสำคัญด้านวัฒนธรรมคือเหตุผลหลักที่ทำให้เขาเข้าร่วม Tencent เขาอธิบายประสบการณ์ครั้งแรกกับผู้นำของ Tencent ว่า “ตรงไปตรงมามาก” และ “ไม่ปิดบังสิ่งใด” Yao อธิบายว่า Tencent ดำเนินงานบนพื้นฐานของความไว้วางใจมากกว่าตัวชี้วัด โดยมี “วัฒนธรรมที่ซื่อสัตย์ถ่อมตัว มีท่าทีเชิงปฏิบัติจริง” และมีพันธสัญญาต่อแนวคิดมองไกลระยะยาว ซึ่งเขามองว่าสำคัญต่อการสร้างองค์กร AI ระยะยาว เหตุผลรองคือพอร์ตผลิตภัณฑ์ที่กว้างใหญ่ของ Tencent ซึ่งให้แหล่งที่มาของปัญหาที่แท้จริงสำหรับการพัฒนาเทคโนโลยี AI

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น