ข่าวประตู (Gate News) วันที่ 29 เมษายน — น้ำหนักของโมเดล Ling-2.6-flash ของ Ant Group ได้ถูกเผยแพร่แบบโอเพนซอร์สแล้ว ซึ่งก่อนหน้านี้มีให้ใช้เฉพาะผ่านทาง API โมเดลนี้มีพารามิเตอร์รวม 104 พันล้าน มีพารามิเตอร์ที่ถูกเปิดใช้งาน 7.4 พันล้านต่อการอนุมาน หน้าต่างคอนเท็กซ์ 256K และมีไลเซนส์ MIT มีเวอร์ชันความแม่นยำ BF16, FP8 และ INT4 ให้ใช้งานบน HuggingFace และ ModelScope.
Ling-2.6-flash นำเสนอการปรับปรุง hybrid linear attention เหนือ Ling 2.0 โดยอัปเกรด GQA ดั้งเดิมเป็นสถาปัตยกรรม 1:7 MLA + Lightning Linear แบบไฮบริด ร่วมกับ MoE ที่มีความเบาบางสูง ประสิทธิภาพในการอนุมานสูงกว่าโมเดลที่เทียบเคียงอย่างมีนัยสำคัญ: ความเร็วการสร้างสูงสุดถึง 340 โทเคน/วินาที บน GPU H20 จำนวน 4 ตัว โดย throughput สำหรับ prefill และ decode สูงกว่าประมาณ 4 เท่าเมื่อเทียบกับโมเดลโอเพนซอร์สที่ใกล้เคียงกัน เกณฑ์การทดสอบที่เกี่ยวกับเอเจนต์แสดงประสิทธิภาพที่แข็งแกร่ง: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval และ PinchBench ทำผลงานได้ถึงหรือเข้าใกล้ระดับ SOTA ในชุดเกณฑ์การทดสอบ Artificial Analysis ทั้งหมด การใช้โทเคนรวมเพียง 15 ล้านเท่านั้น บน AIME 2026 โมเดลทำคะแนนได้ 73.85%.
เว็บไซต์ทางการของ Ant Group ยังระบุเวอร์ชันเรือธง Ling-2.6-1T (trillion-parameter) และเวอร์ชันน้ำหนักเบา Ling-2.6-mini (lightweight version) ด้วย อย่างไรก็ตาม ณ วันที่เผยแพร่ น้ำหนักยังไม่ได้ถูกปล่อยบน HuggingFace โดยมีเพียงซีรีส์ flash เท่านั้นที่พร้อมให้ดาวน์โหลด.
news.related.news
แซม อัลท์แมน เผยภาพหน้าจอ Codex โหมดคู่ แยกอย่างเป็นทางการระหว่างฟังก์ชันสำนักงานและการเขียนโปรแกรม
อัตราส่วนชาร์ปของ XRP แตะ 0.065 ในการฟื้นตัวประจำเดือนเมษายน
NVIDIA เปิดตัว Nemotron 3 Nano Omni แบบโอเพนซอร์สสำหรับมัลติโหมด