ตาม Beating หลังจากเปิดตัวโมเดลโอเพนซอร์ส 25 ตัว รวมถึง Nvidia Nemotron 3 Ultra และ Google Gemma 4 12B ช่องว่างขีดความสามารถระหว่างโมเดลปลายทางโอเพนซอร์สกับแบบปิดกำลังแคบลงอย่างรวดเร็ว แต่การกำหนดราคายังไม่สอดคล้องกันอย่างชัดเจน

นักลงทุนด้านเทคโนโลยี Chamath Palihapitiya ระบุว่า สำหรับองค์กรที่ใช้โทเคนอินพุต 1 พันล้านและโทเคนเอาต์พุต 1 พันล้านต่อเดือน GPT-5.5 Pro มีค่าใช้จ่าย 105,000 ดอลลาร์, Claude Opus 4.8 มีค่าใช้จ่าย 30,000 ดอลลาร์ ขณะที่ DeepSeek R1 มีเพียง 2,740 ดอลลาร์—ทำให้ GPT-5.5 Pro มีราคาพรีเมียมสูงกว่า 40 เท่า

Chamath เตือนว่าผู้บริหารระดับซีอีโอของบริษัทส่วนใหญ่ไม่ทราบว่าทีมวิศวกรรมของตนตั้งค่าเริ่มต้นให้เรียกใช้ API ของโมเดลภาษาขนาดใหญ่ที่แพงที่สุด โดยไม่มีระบบกำกับดูแลหรือการตรวจสอบ ส่งผลให้ต้นทุนบานปลาย เขาคาดการณ์ว่าเมื่อเครื่องมือควบคุมการส่งคำขอโมเดล (model-routing control planes) ได้รับการนำมาใช้ องค์กรต่างๆ จะหันไปใช้สถาปัตยกรรมที่ไม่ยึดติดกับโมเดล (model-agnostic) โดยเลือกผู้ให้บริการอินเฟอเรนซ์ที่คุ้มค่าเป็นค่าเริ่มต้น และสงวน API ระดับพรีเมียมไว้สำหรับกรณีใช้งานที่มีมูลค่าสูงเท่านั้น

news.view.source

news.article.disclaimer

news.related.news

20 ชั่วโมง ที่แล้ว

SpaceX ลงนามข้อตกลงการประมวลผลของ Google แบบรายเดือน $920M กับ Nvidia 110,000 GPU

06-05 08:45

NVIDIA เปิดตัว Nemotron 3.5 ASR และโมเดลความปลอดภัยของเนื้อหาที่มีพารามิเตอร์ 600 ล้าน และ 4 พันล้าน

06-05 07:55

ซัมซุง, SK hynix, Micron ผ่านการรับรองเพื่อจัดหาหน่วยความจำ HBM4 ให้กับ Nvidia Vera Rubin โดยมีกำหนดส่งมอบในไตรมาส 3

06-04 15:49

Nvidia เปิดตัว Nemotron 3 Ultra โมเดลเรือธง 550B พารามิเตอร์ พร้อมสถาปัตยกรรม Hybrid MoE แบบ Mamba-Transformer

06-04 09:14