
อาลีบาบา เปิดตัวซีรีส์ Qwen (Qwen) ประจำสัปดาห์นี้ด้วยโมเดล Qwen3.7-Plus โดยตั้งราคาราคาอินพุต 0.40 ดอลลาร์/ล้าน token และราคเอาต์พุต 1.60 ดอลลาร์/ล้าน token รวม 2.00 ดอลลาร์ ลดลงถึง 80% เมื่อเทียบกับ Qwen3.7-Max ราคอินพุตแบบแคชสามารถลดได้ต่ำถึง 0.04 ดอลลาร์/ล้าน token โดยมีเป้าหมายสำหรับงานที่ต้องทำซ้ำและมีความถี่สูง
ตามข้อมูลด้านราคาที่อาลีบาบาเผยแพร่โดยเป็นทางการ:
อินพุตทั่วไป: 0.40 ดอลลาร์/ล้าน token
เอาต์พุตทั่วไป: 1.60 ดอลลาร์/ล้าน token
รวม (อินพุต+เอาต์พุต): 2.00 ดอลลาร์
อินพุตแบบแคช: 0.04 ดอลลาร์/ล้าน token (ใช้สำหรับสถานการณ์ agent ที่ต้องอ่านซ้ำโค้ดไลบรารีหรือเทมเพลต UI ขององค์กรชุดเดิม)
ตัวเทียบ: Qwen3.7-Max มีอินพุต 2.50 ดอลลาร์, เอาต์พุต 7.50 ดอลลาร์, รวม 10.00 ดอลลาร์ ขณะที่คู่แข่งในจีนอย่าง MiniMax-M3 มีโปรโมชันจำกัดเวลา โดยรวมอยู่ที่ 1.50 ดอลลาร์ และราคาของ Qwen3.7-Plus อยู่ใกล้เคียงกับระดับดังกล่าว
ต่อไปนี้คือตัวเลขการทดสอบมาตรฐานของ Qwen3.7-Plus ที่อาลีบาบาประกาศ โดยเป็นข้อมูลที่ประเมินตนเองทั้งหมด:
Terminal Bench 2.0-Terminus: 70.3 (DeepSeek-V4-Pro Max อยู่ที่ 67.9, Gemini-3.1 Pro อยู่ที่ 63.5)
ScreenSpot Pro (คอมพิวเตอร์วิทัศน์และการทำความเข้าใจอินเทอร์เฟซ): 79.0 (GPT-5.4 xhigh อยู่ที่ 67.4, Claude-Opus-4.6 อยู่ที่ 49.5)
ทั้งนี้ควรสังเกตว่าเอกสารทางการของอาลียังระบุด้วยว่า โดยรวมแล้วประสิทธิภาพของ Qwen3.7-Plus ยังต่ำกว่าหลายโมเดลปิดของสหรัฐที่เป็นผู้นำ ตัวเลขข้างต้นเป็นการเทียบแบบจุดเดียวในงานเฉพาะ ไม่ได้สะท้อนประสิทธิภาพแบบครอบคลุมทั้งหมด
Qwen3.7-Plus ไม่ได้ให้สิทธิ์ดาวน์โหลดน้ำหนักโมเดลแบบโอเพนทั้งหมด การเรียกใช้งาน API ทั้งหมดต้องผ่านการประมวลผลของโหนดระดับนานาชาติของ Alibaba Cloud ข้อมูลจะไหลออกภายนอกจากเซิร์ฟเวอร์ผู้ใช้ ตามสถาปัตยกรรมนี้ มีอุปสรรคด้านการกำกับดูแลที่ชัดเจนในสถานการณ์ต่อไปนี้:
อุตสาหกรรมที่มีข้อจำกัดด้านอำนาจข้อมูลหรือกฎหมาย: การแพทย์ (HIPAA, GDPR), กลาโหม, หน่วยงานรัฐบาล ต้องประเมินว่าการกำหนดเส้นทาง API ภายนอกสอดคล้องกับข้อกำกับดูแลหรือไม่
สถานการณ์ติดตั้งแบบแยกในเครือข่ายภายใน (อินทราเน็ต): ไม่สามารถติดตั้งใช้งานในสภาพแวดล้อมท้องถิ่นที่แยกโดยสิ้นเชิงได้
ในทางกลับกัน ข้อได้เปรียบของโหมด API แบบปิดคือไม่จำเป็นต้องลงทุนและดูแลฮาร์ดแวร์คลัสเตอร์ GPU หลายตัวเอง (เช่น Nvidia H100) และรูปแบบที่เข้ากันได้กับ OpenAI ช่วยลดต้นทุนการปรับเปลี่ยนโครงสร้างพื้นฐานที่มีอยู่ให้เหลือน้อยที่สุด
ราคาแบบแคชใช้กับสถานการณ์ที่ agent ต้องอ่านอินพุตชุดเดิมซ้ำๆ เช่น การเข้าถึงซ้ำโค้ดไลบรารีชุดเดิมอย่างต่อเนื่อง เทมเพลต UI ขององค์กรที่ตายตัว หรือ system prompt ที่คงอยู่เป็นเวลานาน ในเวิร์กโฟลว์ขนาดใหญ่ที่มีงานความถี่สูงและมีความซ้ำซาก กลไกแคชสามารถลดต้นทุน API โดยรวมได้อย่างมาก Alibaba ยังไม่ได้ประกาศรายละเอียดการรับประกันอัตราการแคชฮิตหรือข้อจำกัดในการใช้งานที่ชัดเจน
ก่อนหน้านี้ ซีรีส์ Qwen ออกเผยแพร่ภายใต้ใบอนุญาต Apache 2.0 พร้อมให้ดาวน์โหลดน้ำหนักโมเดล อนุญาตให้ทุกคนสามารถติดตั้งใช้งานภายในเครื่อง ปรับแต่ง (fine-tune) และผสานเข้ากับระบบของตนเองได้ Qwen3.7-Plus ให้บริการผ่าน API ของ Alibaba Cloud เท่านั้น ไม่เผยแพร่น้ำหนักโมเดล ซึ่งหมายความว่าไม่สามารถติดตั้งใช้งานในเครื่องหรือในเครือข่ายที่แยกตัวได้ และการใช้งานทั้งหมดต้องพึ่งพาโครงสร้างพื้นฐานภายนอกของ Alibaba Cloud
คำอธิบายอย่างเป็นทางการของ Qwen3.7-Plus ระบุชัดเจนว่า Terminal Bench และ ScreenSpot Pro เป็นตัวเลขที่อาลีบาบาประเมินตนเอง และโดยรวมแล้วยังต่ำกว่าหลายโมเดลปิดของสหรัฐที่เป็นผู้นำ ตัวเลขจากการทดสอบมาตรฐานสะท้อนประสิทธิภาพแบบจุดเดียวในงานเฉพาะ ไม่ได้หมายถึงค่าเวลาแฝงแบบ end-to-end ความเสถียร หรือประสิทธิภาพแบบครอบคลุมทั้งหมดในสภาพแวดล้อมการใช้งานจริง
news.related.news
PlanB วิเคราะห์: ยังไม่เห็นก้นของ Bitcoin โดยมีโอกาสมากกว่า 50% ที่จะลงไปทดสอบ 53,000
ไมโครซอฟต์ Build เผยแพร่โมเดล AI จำนวน 7 รุ่น โดยใช้โทเคนน้อยกว่าคู่แข่ง 60%
หุ้น Cisco พุ่งขึ้น 5% ในวันเดียว เป้าหมายคำสั่งซื้อด้าน AI เพิ่มเป็น 9 พันล้านดอลลาร์สหรัฐ
Google เปิดตัว $80B การระดมทุนด้วยหุ้น ร่วมกับ Berkshire $10B ของเงินลงทุน
รายละเอียดแบรนด์ Snapdragon Dragonfly เลื่อนถึงวันที่ 24 มิถุนายน ขณะที่หุ้นก่อนเปิดตลาดร่วงมากกว่า 8%