
ในสุนทรพจน์ของเจนเซิน หวง เหรินจวิ่น ซีอีโอของ NVIDIA ในงาน GTC Taipei 2026 ได้อธิบายอย่างเป็นระบบถึงนิยามสถาปัตยกรรมของ AI Agent: โมเดลภาษาขนาดใหญ่ (LLM) ทำหน้าที่คิด ให้เหตุผล และวางแผน ขณะที่เอนจินการเรียบเรียงภายนอก (harness) เปรียบเสมือนระบบปฏิบัติการ ทำหน้าที่เชื่อมโมเดลเข้ากับเครื่องมือต่างๆ เช่น สเปรดชีต เบราว์เซอร์ และฐานข้อมูล รวมถึงบริหารจัดการหน่วยความจำการทำงานและความจำระยะยาว
ในสุนทรพจน์ หวง เหรินจวิ่น แบ่งโครงสร้างหลักของ AI Agent ออกเป็น 2 ส่วน ได้แก่ โมเดลภาษาขนาดใหญ่ในฐานะ “ศูนย์กลางการคิด” รับผิดชอบการให้เหตุผลและการวางแผน; ส่วนเอนจินการเรียบเรียงภายนอกทำหน้าที่เป็นบทบาท “ระบบปฏิบัติการ” เชื่อมโมเดลเข้ากับเครื่องมือต่างๆ พร้อมทั้งจัดการทั้งความจำการทำงานระยะสั้นและความจำระยะยาว
เขาระบุว่า สถาปัตยกรรมนี้สะท้อนถึงการเปลี่ยนแปลงพื้นฐานของรูปแบบการประมวลผล ไม่ใช่แค่การยกระดับเครื่องมือเพื่อความมีประสิทธิภาพที่ดีขึ้นเท่านั้น ระหว่างการสาธิตในงาน เขากล่าวว่า: “ที่นี่เราใช้ Claude Code แต่ Codex ก็ยังทำได้ยอดเยี่ยมเช่นกัน”
หวง เหรินจวิ่น ได้สาธิตกรณีตัวอย่างของ AI Agent จำนวน 3 เคสต่อหน้าผู้ชมในงาน ได้แก่ เคสแรก สร้างโค้ดทั้งแอปพลิเคชันได้โดยตรงผ่านพรอมป์แบบภาษาธรรมชาติ; เคสที่สอง เมื่อป้อนคำอธิบายเป็นข้อความแล้ว Agent จะสร้างแอนิเมชันอนุภาคแบบไดนามิกทันที โดยมีธีมตั้งแต่ Taipei 101 ไปจนถึง GTC Taipei 2026 และโลโก้ NVIDIA; เคสที่สาม ถ่ายรูปหน้างานที่เห็น “ที่หนีบแบตเตอรี่” ของรีโมตคอนโทรลแบบไม่มีแบตเตอรี่ Agent จะเรียกใช้เครื่องมือ CAD อัตโนมัติ แล้วสร้างไฟล์ชิ้นส่วนทดแทนที่สามารถนำไปใช้กับการพิมพ์ 3D ได้ทันที
เมื่อถูกถามเกี่ยวกับคำกล่าวที่แพร่หลายในตลาดว่า “AI Agent จะทำให้บริษัทซอฟต์แวร์ล่มสลาย” หวง เหรินจวิ่น ปฏิเสธอย่างชัดเจนว่า “กลับกันเลย” เขาระบุว่า เมื่อไม่ต้องถูกจำกัดด้วยจำนวนคน มวลของ Agent จำนวนมหาศาลจะใช้เครื่องมือซอฟต์แวร์มากกว่ามนุษย์ “ตอนนี้เป็นยุคที่ดีที่สุดสำหรับการทำบริษัทซอฟต์แวร์” —แต่มีเงื่อนไขว่า ซอฟต์แวร์ต้องถูกออกแบบและนำเสนอในรูปแบบที่ Agent สามารถเรียกใช้งานได้โดยตรง NVIDIA ได้เปิดคลัง CUDA X อย่างครอบคลุมให้ Agent ใช้ และประสิทธิภาพในการใช้งานของ Agent ยังสูงกว่านักพัฒนามนุษย์ด้วย
AI Agent ที่หวง เหรินจวิ่น นิยามไว้ในงาน GTC Taipei 2026 ประกอบด้วย LLM (การให้เหตุผลและการวางแผน) และเอนจินการเรียบเรียง (การเชื่อมต่อเครื่องมือ + การจัดการหน่วยความจำ) ส่วนซอฟต์แวร์ดั้งเดิมคือผู้ใช้ “เปิดโปรแกรม-คลิก-ป้อนข้อมูล” ขณะที่โหมด Agent คือ “บรรยายเจตนารมณ์กับ AI จากนั้น AI จะสร้างโค้ด เรียกใช้เครื่องมือ และส่งออกผลลัพธ์อัตโนมัติ” โดยตัวขับเคลื่อนจากเดิมที่เป็นคนจะย้ายไปอยู่ที่ตัว AI เอง
การสาธิตในงานนี้แสดงให้เห็นความสามารถในการเรียกใช้เครื่องมือหลายประเภทของ Agent: Agent ระบุปัญหาในภาพ (ที่หนีบแบตเตอรี่หายไป) เข้าใจความต้องการ (ต้องการชิ้นส่วนทดแทน) เรียกใช้เครื่องมือ CAD เพื่อสร้างแบบจำลอง และส่งออกไฟล์สำหรับการพิมพ์ 3D ได้ทันที — ทำให้เกิดเวิร์กโฟลว์ครบวงจรจากการรู้จำปัญหาไปจนถึงการหาทางออก โดยไม่ต้องมีมนุษย์คอยแทรกแซงทีละขั้น
หวง เหรินจวิ่น ประกาศว่าคลัง CUDA X ของ NVIDIA ได้เปิดให้ AI Agent ใช้งานอย่างเต็มรูปแบบแล้ว และประสิทธิภาพในการใช้งานของ Agent สูงกว่านักพัฒนามนุษย์ ซึ่งหมายความว่าพื้นฐานโครงสร้างพื้นฐานสำหรับการเร่งความเร็วด้วย AI หลักของ NVIDIA ได้ขยายไปยังระบบนิเวศการพัฒนา Agent อย่างเป็นทางการ พร้อมมอบรากฐานของการเรียกใช้เครื่องมือที่มีประสิทธิภาพมากขึ้นให้แก่ผู้พัฒนา
news.related.news
Vitalik ยืนยัน CROPS AI และชั้นการเข้าถึงของ Ethereum มีความซ้อนทับกัน โดย DeepSeek V4 เป็นเครื่องมือหลัก
มหาวิทยาลัยเซี่ยงไฮ้เจียวทงและ Tencent พัฒนา ProAct AI Agent ที่คาดการณ์ความต้องการของผู้ใช้
โปรเจกต์คริปโตด้านปัญญาประดิษฐ์ที่ดีที่สุด กำลังครองตลาดในปี 2026
TSMC ทำสถิติสูงสุดตลอดกาลที่ 2360 หยวน ขณะที่ หลี่ เย็นซุน กล่าวว่าประเทศไต้หวันคือศูนย์กลางการปฏิวัติด้าน AI
AGNT จับมือกับ PROM สำหรับโครงสร้างพื้นฐานบล็อกเชนของ AI Agent