NVIDIA เปิดพื้นที่ให้เป็นพันธมิตรระยะยาวด้าน AI ของ Deepinfra ระดมทุนรอบ B จำนวน 1.07 พันล้านดอลลาร์สหรัฐ เพื่อสร้าง “โรงงานโทเค็น”

ChainNewsAbmedia
GLM1.19%

สตาร์ทอัพด้านปัญญาประดิษฐ์ DeepInfra ประกาศปิดการระดมทุนรอบ B มูลค่า 1.07 พันล้านดอลลาร์สหรัฐ โดย 500 Global และ Georges Harik วิศวกรรุ่นแรกของ Google เป็นผู้นำการลงทุน ขณะที่นักลงทุนเชิงยุทธศาสตร์อย่าง NVIDIA (NVIDIA), Samsung Next และ Supermicro เข้าร่วมลงทุนด้วย จากข่าวอย่างเป็นทางการเผยว่าเงินที่ได้รับครั้งนี้จะนำไปขยายความจุศูนย์ข้อมูลทั่วโลก เพื่อรับมือกับต้นทุนการคำนวณและคอขวดด้านประสิทธิภาพที่เกิดขึ้นเมื่อการใช้งาน AI ในปัจจุบันเปลี่ยนจาก “การฝึกโมเดล” ไปสู่ “การอนุมานขนาดใหญ่”

ความต้องการการอนุมาน AI พุ่งสูง กลายเป็นคอขวดสำคัญสำหรับการนำไปใช้ในองค์กร

เมื่อ AI ก้าวสู่เชิงพาณิชย์ จุดศูนย์กลางของเวิร์กโหลดในองค์กรก็เปลี่ยนไปอย่างชัดเจน DeepInfra สังเกตว่า นับตั้งแต่รอบ A ปริมาณ Token ที่แพลตฟอร์มประมวลผลของบริษัทเติบโตถึง 25 เท่า แสดงว่า Inference (การอนุมาน) ได้กลายเป็นแรงขับหลักของเวิร์กโหลด AI ในองค์กร ปัจจุบันประสิทธิภาพของโมเดลโอเพนซอร์สสามารถเทียบเคียงระบบเฉพาะทางได้แล้ว ช่วยลดเกณฑ์การเริ่มต้นการสร้างสรรค์ลงอย่างมาก อย่างไรก็ตาม แอปพลิเคชันของเอเจนต์อัจฉริยะ (Agentic Systems) ที่ตามมากำลังทำให้ใช้งานจริงต้องเรียกโมเดลหลายครั้ง—ในงานเดี่ยวอาจต้องกระตุ้นโมเดลมากถึงร้อยครั้ง เนื่องจากแพลตฟอร์มคลาวด์แบบอเนกประสงค์ในอดีตไม่ได้ถูกออกแบบตามความต้องการด้านการอนุมาน ทำให้องค์กรเผชิญความท้าทายทั้งต้นทุนการดำเนินงานที่สูงเกินไปและความหน่วงที่ควบคุมไม่ได้ ส่งผลให้การอนุมานกลายเป็นข้อจำกัดเชิงระบบของเวิร์กโหลด

การบูรณาการแบบแนวดิ่ง ปรับซ้อนเพื่อเพิ่มประสิทธิภาพด้านเศรษฐศาสตร์โทเคน

DeepInfra ใช้กลยุทธ์บูรณาการแบบแนวดิ่ง โดยยืนยันว่าการอนุมานที่มีประสิทธิภาพสูงจำเป็นต้องทำผ่านการออกแบบร่วมกันระหว่างฮาร์ดแวร์ เครือข่าย และซอฟต์แวร์ ทีมงานเคยมีประสบการณ์พัฒนาระบบแบบกระจายสำหรับแอปพลิเคชันสื่อสาร imo ที่รองรับผู้ใช้ 2 ร้อยล้านคน และปัจจุบันได้ก่อตั้งโครงสร้างพื้นฐาน GPU ในสหรัฐฯ แล้ว 8 แห่ง เมื่อเทียบกับผู้ให้บริการที่เช่าความจุจากบุคคลที่สาม DeepInfra มีสิทธิ์ควบคุมสแต็กแบบครบตั้งแต่ระดับชิปไปจนถึงอินเทอร์เฟซ API ซึ่งดีไซน์นี้ทำให้สามารถปรับให้เหมาะกับงานการสร้างโทเคนที่ “ออนไลน์ตลอดเวลา” เพื่อให้เมื่อรันเวิร์กโหลด AI แบบสมองกล งานดังกล่าวสามารถให้ความหน่วงที่คาดการณ์ได้ดีกว่าสภาพแวดล้อมคลาวด์ทั่วไป

Deepinfra เป็นพาร์ทเนอร์โครงสร้างพื้นฐานระยะยาวของ NVIDIA ในระบบนิเวศ AI ที่เปิดกว้าง

Deepinfra เป็นพาร์ทเนอร์โครงสร้างพื้นฐานผู้ร่วมมือรายแรกของ NVIDIA ในระบบนิเวศ AI แบบเปิด โดยสนับสนุนโมเดล Nemotron, สถาปัตยกรรมเอเจนต์ NemoClaw และซอฟต์แวร์อนุมาน NVIDIA Dynamo การติดตั้งใช้งาน GPU รุ่น Blackwell ในระยะแรก และการบูรณาการที่กำลังจะเกิดขึ้นกับ Vera Rubin และ Dynamo จะช่วยยกระดับประสิทธิภาพต้นทุนของการอนุมานได้สูงถึง 20 เท่า

Deepinfra นำเสนอโมเดลโอเพนซอร์สที่มีความสามารถแข่งขัน

ด้านการควบคุมต้นทุน DeepInfra ใช้การทำงานของฮาร์ดแวร์ที่ปรับแต่งอย่างเหมาะสมเพื่อรันโมเดลโอเพนซอร์สมากกว่า 190 โมเดล โดยมุ่งหวังจะให้ราคาที่แข่งขันได้อย่างยิ่งในตลาด ยกตัวอย่างโมเดลการอนุมานโอเพนซอร์ส GLM-5 โดยมีราคาผสมอยู่ที่ 1.24 ดอลลาร์สหรัฐต่อ 1 ล้านโทเคน ซึ่งต่ำกว่าค่าเฉลี่ยในอุตสาหกรรมราว 20% สำหรับ “โมเดลสำหรับการคิด” ที่ต้องใช้การคำนวณโทเคนจำนวนมาก แพลตฟอร์มได้พัฒนากลไกแคชเพื่อให้ส่วนลดสำหรับข้อความคงที่ที่ป้อนซ้ำ ซึ่งช่วยลดต้นทุนของการสนทนาหลายรอบและไปป์ไลน์การสร้างเสริมด้วยการดึงข้อมูล (RAG) ได้อย่างมีประสิทธิภาพ เพื่อรองรับข้อกำหนดด้านความปลอดภัยสำหรับฝั่งองค์กร DeepInfra ให้บริการ API ที่เข้ากันได้กับ OpenAI และให้คำมั่นว่าจะไม่เก็บข้อมูล พร้อมทั้งผ่านการรับรอง SOC 2 และ ISO 27001 เพื่อให้ผู้พัฒนาสามารถนำโมเดลไปใช้กับสภาพแวดล้อมการผลิตจริงได้โดยตรง

ความสำคัญของโครงสร้างพื้นฐานสำหรับการอนุมานเฉพาะทางต่อขั้นถัดไปของ AI

การสนับสนุนของตลาดการลงทุนต่อ DeepInfra สะท้อนให้เห็นว่า ความสำคัญของโครงสร้างพื้นฐานด้าน AI กำลังค่อยๆ เหนือกว่าตัวโมเดลเอง Tony Wang กรรมการผู้จัดการของ 500 Global ระบุว่า ในสภาพแวดล้อมการพัฒนาที่ขับเคลื่อนด้วยเอเจนต์ ผู้พัฒนาต้องการแพลตฟอร์มเฉพาะทางที่มีความยืดหยุ่น ความเร็ว และความน่าเชื่อถือหลังจากปิดการระดมทุนในรอบนี้ DeepInfra มีมูลค่าระดมทุนรวมอยู่ที่ 1.33 พันล้านดอลลาร์สหรัฐ โดยเงินจะนำไปใช้เพื่อขยายความสามารถในการประมวลผลทั่วโลก เพิ่มและพัฒนาชุดเครื่องมือสำหรับนักพัฒนา และสนับสนุนโมเดลเอเจนต์อัจฉริยะรุ่นถัดไป เมื่อปริมาณการประมวลผลโทเคนต่อสัปดาห์ใกล้ถึง 5 ล้านล้านโทเคน DeepInfra ตั้งเป้าจะสร้าง “โรงงานโทเคน” ที่มีประสิทธิภาพสูง เพื่อเป็นฐานกำลังประมวลผลที่ยั่งยืนสำหรับการใช้งาน AI ในระดับขนาดขององค์กร

บทความนี้ 輝達開放AI長期夥伴Deepinfra獲1.07億美元B輪融資建立「代幣工廠」 ปรากฏครั้งแรกใน 鏈新聞 ABMedia

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น