Alibaba เปิดตัวโมเดลเอเจนต์โอเพนซอร์ส AgenticQwen: เวอร์ชัน 8B เข้าใกล้ประสิทธิภาพ 235B ด้วย Dual Data Flywheels

GateNews

ข่าวประจำเกต วันที่ 27 เมษายน — ทีม PAI ของ Alibaba ได้เผยแพร่และเปิดซอร์ส AgenticQwen ซึ่งเป็นโมเดลภาษาระดับเอเจนต์ขนาดเล็ก ออกแบบมาสำหรับงานประยุกต์เรียกใช้เครื่องมือระดับอุตสาหกรรม โมเดลนี้มีให้เลือก 2 เวอร์ชัน ได้แก่ 8B และ 30B-A3B ได้รับการฝึกผ่านกรอบการเรียนรู้แบบเสริมแรง “dual data flywheel” ที่เป็นนวัตกรรม AgenticQwen บรรลุความสามารถระดับเอเจนต์ที่เทียบใกล้กับโมเดลระดับเกือบหนึ่งล้านล้านพารามิเตอร์ ขณะเดียวกันลดต้นทุนการอินเฟอเรนซ์ได้อย่างมีนัยสำคัญ

กลไก dual data flywheel แก้ปัญหาการทำข้อมูลสังเคราะห์ให้มีลักษณะเหมือนกันเกินไปในข้อมูลสังเคราะห์แบบดั้งเดิม reasoning flywheel จะสร้างตัวแปรที่ยากขึ้นโดยอัตโนมัติจากข้อผิดพลาดของโมเดล ในขณะที่ agentic flywheel จะขยายเวิร์กโฟลว์เชิงเส้นอย่างง่าย (เช่น กระบวนการจองตั๋ว)ให้กลายเป็นพฤติกรรมแบบ multi-branch behavior trees พร้อมข้อจำกัด การปฏิเสธ และเงื่อนไขเชิงปฏิปักษ์ จำลองสถานการณ์การตัดสินใจที่ซับซ้อนในโลกความเป็นจริง ผลการทดสอบชี้ว่า AgenticQwen-8B ทำคะแนนได้ 47.4 บนเกณฑ์วัดสภาพแวดล้อมเครื่องมือจริง (TAU-2 และ BFCL-V4) ซึ่งสูงกว่าพื้นฐาน Qwen3-8B (23.8) อย่างมาก และเข้าใกล้ Qwen3-235B (52.0) AgenticQwen-30B-A3B (โดยมีเพียง 3B พารามิเตอร์ที่ถูกเปิดใช้งาน) ทำคะแนนได้ 50.2.

โมเดลนี้ถูกนำไปใช้งานในระบบการผลิตภายในที่คล้ายกับ Manus ทำให้ช่องว่างกับโมเดล 235B ในด้านเวลาอินเฟอเรนซ์แบบ end-to-end แคบลงอย่างมาก อย่างไรก็ตาม โมเดลถูกจำกัดด้วยความยาวบริบทดั้งเดิม 40K โทเค็น ซึ่งส่งผลให้ประสิทธิภาพของมันลดลงในงาน deep search

news.article.disclaimer

btc.bar.articles

Garry Tan: ตอนนี้ผมน้อยมากที่จะป้อนคำสั่งให้กับ AI! CEO ของ YC อธิบาย "เวิร์กโฟลว์ AI ที่ทบต้นได้"

แกร์รี แทน เพิ่งเผยแพร่บทความฉบับยาว “Meta-Meta-Prompting: The Secret to Making AI Agents Work” ซึ่งเปิดเผยอย่างละเอียดว่าเขาสร้างระบบ “สมองที่สอง” ขับเคลื่อนด้วย AI agent อย่างไร เขาระบุว่าในช่วง 5 เดือนที่ผ่านมา AI ทำให้เขากลับมาเป็นนักสร้าง (builder) อีกครั้ง และถึงขั้นเปลี่ยนวิธีทำงานประจำวันของเขาในฐานะซีอีโอ/ประธานของ Y Combinator อย่างสิ้นเชิง ซีอีโอ YC: อนาคตเป็นของคนที่สร้าง compound AI systems แกร์รี แทนมองว่า คนส่วนใหญ่ยังใช้ AI เป็นเหมือนหน้าต่างแชท แต่โอกาสที่แท้จริงคือการมอง AI เป็

ChainNewsAbmedia43 นาที ที่แล้ว

UXLINK จับมือ Haven AI เพื่อเปิดตัวเครื่องมือสร้างผลตอบแทน DeFi ข้ามสายโซ่ที่ขับเคลื่อนด้วย AI

ตามประกาศของ UXLINK เมื่อวันที่ 9 พฤษภาคม แพลตฟอร์มได้ร่วมมือกับ Haven AI เพื่อเปิดตัวเอเจนต์ AI ที่สามารถแปลงคำสั่งด้วยภาษาธรรมชาติให้เป็นกลยุทธ์ DeFi แบบอัตโนมัติข้ามสายโซ่ ความร่วมมือนี้มีเป้าหมายเพื่อทำให้การสร้างผลตอบแทนง่ายขึ้น และลดอุปสรรคทางเทคนิคสำหรับผู้ใช้งาน Web3 ที่เข้าร่วมในระบบนิเวศ SocialFi เอเจนต์ AI ของ Haven AI รวมถึง OpenClaw ช่วยให้ผู้ใช้กำหนดเป้าหมายการลงทุนได้ด้วยภาษาที่เข้าใจง่าย แทนที่จะต้องใช้การเขียนโค้ดที่ซับซ้อน จากนั้นจึงดำเนินการตามวัตถุประสงค์เหล่านั้นโดยอัตโนมัติ

GateNews56 นาที ที่แล้ว

Trust Wallet และ Mesh เปิดตัวความสามารถของ AI Agent ที่ Consensus Miami

ตามรายงานของ CoinDesk Trust Wallet และ Mesh ได้ประกาศอัปเดตสถาปัตยกรรมวอลเล็ตเมื่อวันที่ 9 พฤษภาคม ที่งาน Consensus Miami เพื่อรองรับเอเจนต์ AI โดย Mesh เปิดตัว Smart Funding ซึ่งจะกำหนดเส้นทางการชำระเงินอัตโนมัติข้ามเชนและรองรับทั้งผู้ใช้งานและเอเจนต์ AI Trust Wallet เปิดตัวฟีเจอร์ AI co-pilot ในวอลเล็ตสำหรับผู้บริโภค พร้อมคงการดูแลกุญแจของผู้ใช้ไว้ และได้ปล่อย Agent Kit สำหรับนักพัฒนาเพื่อให้เอเจนต์สามารถดำเนินการธุรกรรมได้อย่างอิสระ นอกจากนี้ Trust Wallet ยังได้นำ EIP-8004 มาใช้เพื่อสร้างตัวต

GateNews17 ชั่วโมง ที่แล้ว

Google DeepMind AI ร่วมเป็นโค-นักคณิตศาสตร์ ทำคะแนน 47.9% บน FrontierMath Tier 4 เอาชนะ GPT-5.5 Pro และแก้ปัญหาที่เคยแก้ไม่ได้มาก่อน 3 ข้อ

Google DeepMind เปิดตัวผู้ช่วยโค-นักคณิตศาสตร์ด้วย AI ซึ่งเป็นผู้ช่วยวิจัยคณิตศาสตร์แบบหลายเอเจนต์ ทำผลความแม่นยำ 47.9% บนเกณฑ์ FrontierMath Tier 4 แซงหน้าสถิติก่อนหน้าของ GPT-5.5 Pro ที่ 39.6% เมื่อวันที่ 9 พฤษภาคม ระบบสามารถแก้ได้ 23 จาก 48 โจทย์ รวมถึง 3 ข้อที่โมเดลก่อนหน้านี้ทั้งหมดแก้ไม่ได้ สร้างบน Gemini 3.1 Pro สถาปัตยกรรมใช้การออกแบบแบบลำดับชั้น โดยมีเอเจนต์ประสานงานโครงการเป็นผู้แจกจ่ายงานให้กับเอเจนต์ย่อยที่รับผิดชอบการค้นคืนวรรณกรรม การเขียนโค้ด และการให้เหตุผล พร้อมด้วยเอเจนต์ผู้ทบทว

GateNews20 ชั่วโมง ที่แล้ว

OpenAI เผยคะแนน CoT ส่งผลกระทบโดยไม่คาดคิด: การคงการตรวจสอบสายโซ่ความคิด (CoT) คือแนวป้องกันสำคัญในการทำให้ AI Agent ตรงแนว

เมื่อวันที่ 8 พฤษภาคม OpenAI เผยแพร่การศึกษารูปแบบใหม่ โดยเปิดเผยว่าระหว่างกระบวนการฝึกการเรียนรู้เชิงเสริมแรง (RL) บริษัทได้ “ให้คะแนนอย่างไม่ตั้งใจ” ต่อ chain of thought (CoT) ของบางโมเดล ซึ่งอาจส่งผลต่อความสามารถในการตรวจสอบการจัดแนวของ AI Agent (alignment) ทีมงาน OpenAI Alignment รายงานว่า การคงไว้ซึ่งความสามารถในการตรวจสอบ CoT เป็นด่านป้องกันสำคัญในปัจจุบันต่อการรับมือกับความล้มเหลวของการจัดแนวของ AI Agent ในการออกแบบการฝึก RL ของ OpenAI นั้น ตั้งใจหลีกเลี่ยงการลงโทษ “การให้เหตุผลที่จัดแนวล

ChainNewsAbmedia23 ชั่วโมง ที่แล้ว

หน่วยงานรัฐบาลจีน 3 แผนก ออกแนวทางเพื่อพัฒนาอินเทอร์เน็ตอัจฉริยะในวันที่ 8 พฤษภาคม

ตามที่ Gelonghui ระบุว่า หน่วยงานกำกับดูแลไซเบอร์สเปซของจีน คณะกรรมการพัฒนาและปฏิรูปแห่งชาติ และกระทรวงอุตสาหกรรมและเทคโนโลยีสารสนเทศ ได้ออกคำแนะนำ “ความเห็นการนำไปปฏิบัติเกี่ยวกับการประยุกต์ใช้อย่างเป็นมาตรฐานและการพัฒนาอย่างสร้างสรรค์ของตัวแทนทางปัญญา” ร่วมกันเมื่อวันที่ 8 พฤษภาคม นโยบาย

GateNews05-09 05:52
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น