JD Cloud เปิดตัวโมเดล MiniMax M3 วันนี้ พร้อมการอนุมานที่ปรับให้เหมาะสม

ตาม JD Cloud โมเดล MiniMax M3 ได้เปิดตัวอย่างเป็นทางการวันนี้ (1 มิถุนายน) โดยแพลตฟอร์มสำหรับพัฒนาโมเดล JoyBuilder ของบริษัทจะถูกผสานเข้ากับโมเดลใหม่ทันที ใช้ประโยชน์จากเฟรมเวิร์กการอินเฟอเรนซ์แบบเป็นกรรมสิทธิ์ของ JD Cloud และเทคนิคการปรับแต่ง รวมถึง PD-separated deployment, KV Cache และ speculative sampling แพลตฟอร์มดังกล่าวทำให้เกิดการปรับปรุงอย่างมีนัยสำคัญทั้งในด้านความเร็วการประมวลผลอินเฟอเรนซ์ (inference throughput) และประสิทธิภาพในการตอบกลับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น