ข่าวประตู (Gate News) วันที่ 29 เมษายน — น้ำหนักของโมเดล Ling-2.6-flash ของ Ant Group ได้ถูกเผยแพร่แบบโอเพนซอร์สแล้ว ซึ่งก่อนหน้านี้มีให้ใช้เฉพาะผ่านทาง API โมเดลนี้มีพารามิเตอร์รวม 104 พันล้าน มีพารามิเตอร์ที่ถูกเปิดใช้งาน 7.4 พันล้านต่อการอนุมาน หน้าต่างคอนเท็กซ์ 256K และมีไลเซนส์ MIT มีเวอร์ชันความแม่นยำ BF16, FP8 และ INT4 ให้ใช้งานบน HuggingFace และ ModelScope.

Ling-2.6-flash นำเสนอการปรับปรุง hybrid linear attention เหนือ Ling 2.0 โดยอัปเกรด GQA ดั้งเดิมเป็นสถาปัตยกรรม 1:7 MLA + Lightning Linear แบบไฮบริด ร่วมกับ MoE ที่มีความเบาบางสูง ประสิทธิภาพในการอนุมานสูงกว่าโมเดลที่เทียบเคียงอย่างมีนัยสำคัญ: ความเร็วการสร้างสูงสุดถึง 340 โทเคน/วินาที บน GPU H20 จำนวน 4 ตัว โดย throughput สำหรับ prefill และ decode สูงกว่าประมาณ 4 เท่าเมื่อเทียบกับโมเดลโอเพนซอร์สที่ใกล้เคียงกัน เกณฑ์การทดสอบที่เกี่ยวกับเอเจนต์แสดงประสิทธิภาพที่แข็งแกร่ง: BFCL-V4, TAU2-bench, SWE-bench Verified (61.2%), Claw-Eval และ PinchBench ทำผลงานได้ถึงหรือเข้าใกล้ระดับ SOTA ในชุดเกณฑ์การทดสอบ Artificial Analysis ทั้งหมด การใช้โทเคนรวมเพียง 15 ล้านเท่านั้น บน AIME 2026 โมเดลทำคะแนนได้ 73.85%.

เว็บไซต์ทางการของ Ant Group ยังระบุเวอร์ชันเรือธง Ling-2.6-1T (trillion-parameter) และเวอร์ชันน้ำหนักเบา Ling-2.6-mini (lightweight version) ด้วย อย่างไรก็ตาม ณ วันที่เผยแพร่ น้ำหนักยังไม่ได้ถูกปล่อยบน HuggingFace โดยมีเพียงซีรีส์ flash เท่านั้นที่พร้อมให้ดาวน์โหลด.

news.view.source

news.article.disclaimer

news.related.news

04-28 16:30

NVIDIA เปิดตัวโมเดลมัลติโหมด Nemotron 3 Nano Omni พร้อมเพิ่มประสิทธิภาพทรูพุต 9 เท่า

04-28 11:13

Meituan เปิดตัว LongCat-2.0-Preview อย่างเงียบ ๆ โมเดล AI ที่มีพารามิเตอร์ระดับล้านล้าน ไม่มีประกาศอย่างเป็นทางการ

04-28 11:02

Kimi K2.6 ครองอันดับ LLM ของ OpenRouter ในสัปดาห์แรก สถิติการใช้งานพุ่ง 7,683%

04-27 23:49

Xiaomi 的 MiMo-V2.5 系列开源：1T 参数，且相较 GPT-5.4 具备更高的 token 效率

04-27 14:01