ตาม Beating หลังจากเปิดตัวโมเดลโอเพนซอร์ส 25 ตัว รวมถึง Nvidia Nemotron 3 Ultra และ Google Gemma 4 12B ช่องว่างขีดความสามารถระหว่างโมเดลปลายทางโอเพนซอร์สกับแบบปิดกำลังแคบลงอย่างรวดเร็ว แต่การกำหนดราคายังไม่สอดคล้องกันอย่างชัดเจน
นักลงทุนด้านเทคโนโลยี Chamath Palihapitiya ระบุว่า สำหรับองค์กรที่ใช้โทเคนอินพุต 1 พันล้านและโทเคนเอาต์พุต 1 พันล้านต่อเดือน GPT-5.5 Pro มีค่าใช้จ่าย 105,000 ดอลลาร์, Claude Opus 4.8 มีค่าใช้จ่าย 30,000 ดอลลาร์ ขณะที่ DeepSeek R1 มีเพียง 2,740 ดอลลาร์—ทำให้ GPT-5.5 Pro มีราคาพรีเมียมสูงกว่า 40 เท่า
Chamath เตือนว่าผู้บริหารระดับซีอีโอของบริษัทส่วนใหญ่ไม่ทราบว่าทีมวิศวกรรมของตนตั้งค่าเริ่มต้นให้เรียกใช้ API ของโมเดลภาษาขนาดใหญ่ที่แพงที่สุด โดยไม่มีระบบกำกับดูแลหรือการตรวจสอบ ส่งผลให้ต้นทุนบานปลาย เขาคาดการณ์ว่าเมื่อเครื่องมือควบคุมการส่งคำขอโมเดล (model-routing control planes) ได้รับการนำมาใช้ องค์กรต่างๆ จะหันไปใช้สถาปัตยกรรมที่ไม่ยึดติดกับโมเดล (model-agnostic) โดยเลือกผู้ให้บริการอินเฟอเรนซ์ที่คุ้มค่าเป็นค่าเริ่มต้น และสงวน API ระดับพรีเมียมไว้สำหรับกรณีใช้งานที่มีมูลค่าสูงเท่านั้น