ผู้เขียน: เสี่ยวจิ่ง
คำศัพท์ใหม่ใน Silicon Valley กำลังเป็นที่นิยม: Tokenmaxxing (การใช้ Token สูงสุด)
ในบริษัท Meta และ OpenAI วิศวกรเริ่มแข่งขันกันในอันดับการใช้งาน AI ตามรายงานจากสื่อภายนอก มีวิศวกรคนหนึ่งใช้ Token ถึง 210 พันล้านในหนึ่งสัปดาห์ เทียบเท่ากับเนื้อหาวิกิพีเดีย 33 เล่ม บางคนมีบิลค่า AI ต่อเดือนสูงถึง 150,000 ดอลลาร์
วิศวกรคนหนึ่งที่ทำงานอยู่ที่ Ericsson ในสตอกโฮล์ม ใช้เงินบน Claude มากกว่าค่าแรงของตัวเอง แต่ค่าใช้จ่ายนี้บริษัทเป็นผู้รับผิดชอบ งบประมาณ Token กำลังกลายเป็นสวัสดิการรูปแบบใหม่ของวิศวกร “เหมือนกับขนมฟรีหรืออาหารกลางวันฟรีในอดีต”
Tobi Lütke ซีอีโอของ Shopify ได้ออกบันทึกภายในเมื่อเมษายน 2025 ประกาศว่า “การใช้งาน AI เป็นพื้นฐานที่คาดหวังของ Shopify” และให้ทุกทีมต้องพิสูจน์ว่า AI ไม่สามารถทำงานนั้นได้ก่อนจะขอรับพนักงานใหม่ รวมถึงนำการใช้งาน AI เข้าสู่การประเมินผลการปฏิบัติงานด้วย ต่อมา Meta ก็ประกาศตั้งแต่ปี 2026 เป็นต้นไปว่าจะบรรจุ “อิทธิพลจาก AI” เข้าสู่การประเมินผลพนักงานอย่างเป็นทางการ
เมื่อ Token ถูกนำมาเป็น KPI การใช้งานมันก็กลายเป็นสัญญาณพฤติกรรมขององค์กร
ในขณะเดียวกัน สัญญาณในอุตสาหกรรมก็แน่นหนาเช่นกัน เมื่อวันที่ 16 มีนาคม Jensen Huang ได้กล่าวในงาน NVIDIA GTC ว่า Token เป็น “รากฐานของยุค AI” และจะกลายเป็น “สินค้าโภคภัณฑ์ที่มีมูลค่าสูงสุด” วันถัดมา Alibaba ก็ประกาศตั้งกลุ่มธุรกิจ Alibaba Token Hub โดย CEO Wu Yongming รับผิดชอบโดยตรง ซึ่งมุ่งเน้น “สร้าง Token ส่งต่อ Token และใช้งาน Token”
ภาพ: Jensen Huang แสดงกราฟความสัมพันธ์ระหว่างต้นทุนและรายได้ของ Token ในการบรรยาย GTC โดยแบ่งศูนย์ข้อมูลเป็นชั้นฟรี ชั้นกลาง ชั้นระดับสูง และชั้นพรีเมียม เพื่อจัดสรรพลังการคำนวณ พร้อมแสดงการคาดการณ์ว่า ชิป Vera Rubin จะเพิ่มรายได้ขึ้น 5 เท่าจาก Grace Blackwell
เมื่อปีก่อน Token ยังเป็นเพียงหน่วยวัดเทคนิคที่นักพัฒนาสนใจเท่านั้น ตอนนี้มันกลายเป็นภาษาที่บริษัทชิปใช้กำหนดมูลค่าของผลิตภัณฑ์ และเป็นเหตุผลที่บริษัทยักษ์ใหญ่ปรับโครงสร้างกลุ่มธุรกิจรอบ ๆ มัน รวมถึงกลายเป็นสวัสดิการใหม่และ KPI หลักในข้อเสนอของวิศวกร
แต่การจัดอันดับ Tokenmaxxing ก็แค่บันทึกปริมาณการใช้งาน ไม่มีใครบันทึกว่าจริง ๆ แล้ว Token นั้นทำงานอะไรได้บ้าง
นี่คือจุดบอดที่ใหญ่ที่สุดในเศรษฐกิจ Token ในวันนี้
210 พันล้าน Token ฟังดูเป็นตัวเลขที่น่าตกใจ แต่เพื่อเข้าใจความหมายที่แท้จริง ต้องละทิ้งสมมุติฐานหนึ่งก่อน: Token เป็นของมาตรฐาน
ภาพ: สถิติการใช้งาน Token ทั่วโลกบน Tokscale ซึ่งเป็นเครื่องมือเปิดเผยและติดตามการใช้งาน Token รองรับแพลตฟอร์มต่าง ๆ เช่น Claude Code, Cursor, OpenCode, Codex ผู้ใช้สามารถส่งข้อมูลเพื่อจัดอันดับทั่วโลก
สองปีก่อน ราคาของโมเดลขนาดใหญ่ยังค่อนข้างง่าย โดยมีแค่ราคาพื้นฐานของ Token เข้าสู่ระบบและออกจากระบบ แต่ปัจจุบัน ผู้ให้บริการหลัก ๆ ได้แบ่งชั้นราคาชัดเจน ในแต่ละการเรียกใช้งาน “Token” อาจมีราคาที่แตกต่างกันอย่างสิ้นเชิงตามเงื่อนไขการเรียกใช้งาน
ตัวอย่างเช่น Anthropic Claude Opus 4.6 ราคาขาเข้าอยู่ที่ 5 ดอลลาร์ต่อหนึ่งล้าน Token ขาออก 25 ดอลลาร์ หากเปิดใช้ Prompt Caching ราคาการเขียนแคช 5 นาทีอยู่ที่ 6.25 ดอลลาร์, 1 ชั่วโมง 10 ดอลลาร์, การอ่านแคช 0.50 ดอลลาร์ หากใช้ Batch API ราคาขาเข้าและออกจะลดครึ่งหนึ่ง และหากระบุให้ทำงานในสหรัฐอเมริกา ราคาจะเพิ่มขึ้น 10% ในโหมด Fast Mode ราคาขาเข้าและออกของ Opus 4.6 จะเพิ่มเป็น 6 เท่าของราคามาตรฐาน
หมายความว่า หน่วยเก็บเงินเดียวกัน เช่น “Token” ของผู้ให้บริการรายเดียวกันและโมเดลเดียวกัน ก็อาจมีราคาที่แตกต่างกันหลายเท่าตามเงื่อนไข เช่น การแคช การประมวลผลเป็นกลุ่ม การทำงานในพื้นที่ต่าง ๆ และความเร็ว
ต้นทุนที่แท้จริงที่ทำให้ต้นทุนสูงขึ้น ไม่ใช่แค่ค่าการเรียกใช้งานโมเดลอีกต่อไป แต่รวมถึงค่าใช้จ่ายด้านฮาร์ดแวร์ การเก็บข้อมูล และการประมวลผลต่าง ๆ ที่เพิ่มขึ้นอย่างต่อเนื่อง ตัวอย่างเช่น ตารางราคาของ OpenAI ปัจจุบันแสดงให้เห็นว่า Web Search คิดค่าบริการแยกตามโมเดล เช่น สำหรับ GPT-4.1, GPT-4o ค่าค้นหาเว็บอยู่ที่ 10 ดอลลาร์ต่อพันครั้ง ในขณะที่สำหรับโมเดลเชิงเหตุผลอย่าง GPT-5 คิด 25 ดอลลาร์ต่อพันครั้ง
ค่า File Search ก็อยู่ที่ 2.50 ดอลลาร์ต่อพันครั้ง พร้อมกับค่าจัดเก็บข้อมูลแบบเวกเตอร์ 0.10 ดอลลาร์ต่อ GB ต่อวัน โดยมี 1 GB แรกให้ใช้ฟรี คอนเทนเนอร์โค้ดก็กลายเป็นรายการคิดค่าบริการแยก เช่น คอนเทนเนอร์ 1 GB คิด 0.03 ดอลลาร์, 4 GB, 16 GB, 64 GB ก็มีราคาที่สูงขึ้น ตั้งแต่วันที่ 31 มีนาคม 2026 เป็นต้นไป ราคานี้จะเปลี่ยนเป็นการคิดค่าบริการตาม session ต่อคอนเทนเนอร์ทุก 20 นาที
นอกเหนือจากโมเดลแล้ว การค้นหา การดึงข้อมูล การเก็บข้อมูล และสภาพแวดล้อมการทำงาน ก็กลายเป็นต้นทุนแยกต่างหากที่เคยถูกมองว่าเป็น “ความสามารถเสริม”
Google ก็เดินตามแนวทางเดียวกัน หน้าเว็บของ Vertex AI ระบุว่า ตั้งแต่วันที่ 11 กุมภาพันธ์ 2026 เป็นต้นไป Agent Engine ใน Code Execution, Sessions และ Memory Bank จะเริ่มคิดค่าบริการอย่างเป็นทางการ โดยคิดเป็นชั่วโมง vCPU และ GB หน่วยความจำ
ดังนั้น การพูดถึง “ราคาของโมเดลขนาดใหญ่” ในวันนี้ จึงไม่สามารถมองแค่ราคาขาเข้า-ออก Token ได้อีกต่อไป สิ่งที่เปลี่ยนไปคือกลไกการคิดค่าบริการ ซึ่งตอนนี้ผู้ให้บริการโมเดลขนาดใหญ่ขายเป็นชุดเครื่องมือที่สามารถรัน เก็บข้อมูล ค้นหา เรียกใช้ และดำเนินการต่อเนื่องได้อย่างสมบูรณ์
ภาพ: หน้าจอราคาของ OpenAI แสดงโครงสร้างค่าบริการหลายชั้น (Web Search, File Search, Container ฯลฯ) ซึ่งเป็นรายการคิดค่าบริการแยกต่างหาก
ถ้าดูแค่ราคาบน API ของโมเดล Token ก็ใกล้เคียงกับราคาถูกสุดแล้ว เช่น Opus ของ Anthropic ลดราคาจาก 15 ดอลลาร์ต่อหนึ่งล้าน Token เหลือ 5 ดอลลาร์ ลดลงถึงสองในสาม DeepSeek V3.2 อยู่ที่ 0.28 ดอลลาร์ Google Gemini 2.5 Flash Lite ต่ำสุดประมาณ 0.10 ดอลลาร์
ราคาของโมเดลในจีนก็ชัดเจนขึ้น เช่น OpenRouter ข้อมูลแสดงว่า ราคาของโมเดลจีนต่อ Token อยู่ประมาณหนึ่งในหกถึงหนึ่งในสิบของคู่แข่งต่างประเทศ แม้ Tencent Cloud Mix Yuan HY2.0 Instruct หลังจากสิ้นสุดการทดลองใช้งานและปรับขึ้นราคามากกว่า 460% ราคาขาเข้าอยู่ที่ประมาณ 0.62 ดอลลาร์ต่อหนึ่งล้าน Token ก็ยังต่ำกว่าราคาโมเดลที่ถูกที่สุดของ Anthropic อย่าง Haiku 4.5 (1 ดอลลาร์) และน้อยกว่าห้าส่วนของ Sonnet 4.6
ภาพ: Artificial Analysis รวบรวมอันดับโมเดล LLM แบบเรียลไทม์ ซึ่งราคาต่างกันอย่างมากระหว่างโมเดลต่าง ๆ
แต่ต้นทุนรวมของการใช้งาน AI กลับไม่ลดลงตาม ราคาของโมเดลลดลง แต่มีสามกลไกที่ทำให้ต้นทุนรวมสูงขึ้นพร้อมกัน
หนึ่ง โมเดลฉลาดขึ้น แต่ก็พูดมากขึ้น รายงานของ Artificial Analysis ระบุว่า ค่า Token สำหรับการคำนวณเชิงเหตุผล (reasoning) ของโมเดลเฉลี่ยแล้วใช้ Token มากกว่ารุ่นไม่เชิงเหตุผลประมาณ 5.5 เท่า ทั้ง Anthropic และ OpenAI จะคิดค่าบริการ extended thinking Token เป็นค่าออก Token ยิ่งโมเดลคิดลึกเท่าไหร่ ค่าใช้จ่ายก็ยิ่งสูงขึ้น ราคาต่อ Token ลดลง แต่จำนวน Token ที่ใช้ในการทำงานเดียวกันกลับเพิ่มขึ้นหลายเท่า
สอง Agent ทำให้ Token กลายเป็น “การใช้งานต่อเนื่อง” ไม่ใช่แค่ “ครั้งเดียว” ซึ่งเป็นแรงผลักดันเชิงลึกของ Tokenmaxxing วิศวกรไม่ได้ใช้ Token ด้วยตนเอง แต่ AI programming agent ของพวกเขาทำงานตลอด 24 ชั่วโมง แยกงาน เรียกใช้เครื่องมือ และทำการปรับปรุงตัวเองโดยอัตโนมัติ ข้อมูลจาก Alibaba Cloud ระบุว่า พลังการคำนวณของ Agent หนึ่งตัวใช้พลังงาน 100 ถึง 1000 เท่าของ Chatbot แบบเดิม โดยรวมแล้ว Token ที่ใช้ในจีนในปี 2025 กลาง ๆ ก็ทะลุ 30 ล้านล้านต่อวัน และในกุมภาพันธ์ 2026 ก็พุ่งขึ้นเป็น 180 ล้านล้าน
สาม ต้นทุนการผลิต Token พื้นฐานก็เพิ่มขึ้น เช่น วันที่ 18 มีนาคม 2026 Alibaba Cloud และ Baidu Cloud ประกาศปรับขึ้นราคาสินค้า AI ทั้งด้านพลังการคำนวณและการเก็บข้อมูล สูงสุดถึง 34% AWS ก็ปรับขึ้นราคาสินค้าการเรียนรู้ของเครื่องประมาณ 15% และ Google Cloud ก็ประกาศปรับขึ้นค่าบริการโครงสร้างพื้นฐาน AI ตั้งแต่เดือนพฤษภาคม
ผู้เชี่ยวชาญด้านคลาวด์รายหนึ่งกล่าวว่า “การปรับราคาครั้งนี้เป็นผลจากสมดุลอุปสงค์อุปทานและต้นทุน ซึ่งเป็นปัจจัยหลักในการกำหนดราคาในอนาคต”
GPU การเก็บข้อมูลแบบคู่ขนาน เครือข่ายความเร็วสูง และไฟฟ้าศูนย์ข้อมูล ราคาของโมเดลลดลง แต่ทุกอย่างที่ใช้ผลิต Token กลับขึ้นราคา เช่นเดียวกับที่ Anthropic เน้นว่า “ราคายังคงที่” เมื่อเปิดตัว Opus 4.6 หมายความว่า ความสามารถที่เพิ่มขึ้นนั้นผู้ผลิตเป็นผู้รับภาระเอง
พูดอีกนัยหนึ่ง โมเดลเป็นเครื่องยนต์ แต่ค่าน้ำมัน ค่าที่จอดรถ และค่าทางด่วนต่าง ๆ ก็ขึ้นราคาเช่นกัน
กลไกทั้งสามนี้รวมกัน ทำให้เกิดช่องว่างระหว่างราคาขาย Token กับต้นทุนจริงของงานที่ต้องทำให้แตกต่างกันมากขึ้นเรื่อย ๆ
กลับมาที่ Tokenmaxxing สถิติในอันดับบันทึกการใช้งาน Token เท่านั้น แต่ไม่ได้บันทึกคุณภาพของผลลัพธ์ ผลงานของวิศวกรที่ใช้ Token ถึง 33 วิกิพีเดียในหนึ่งสัปดาห์ ไม่ได้หมายความว่าเขาทำงานได้เท่ากับ 33 วิกิพีเดียคุณภาพสูง
บริษัทยักษ์ใหญ่บันทึกการใช้งาน Token เป็น KPI หรือเป็นสวัสดิการในเชิงกลยุทธ์ แท้จริงแล้วมันเป็นการแสดงความสามารถด้านการผลิตหรือเป็นการแสดงภาพลักษณ์เท่านั้นหรือไม่?
นี่คือจุดบกพร่องเชิงโครงสร้างของเศรษฐกิจ Token ซึ่งอุตสาหกรรมยังไม่มีมาตรฐานวัดผลที่เชื่อถือได้ระหว่างการใช้งาน Token กับความสำเร็จของงาน Token วัดที่การลงทุน ไม่ใช่ผลผลิต วิศวกรคนหนึ่งใช้ Token 1 แสนล้านเพื่อทำงานหนึ่งชิ้น กับอีกคนใช้ 1 หมื่นล้านเพื่อทำงานเดียวกัน ผลลัพธ์ในอันดับ Tokenmaxxing ก็ตรงกันข้ามกัน
Lütke ซีอีโอของ Shopify เขียนในบันทึกว่า บางคนกำลังสร้าง “ผลผลิต 10 เท่าที่เคยคิดว่าน่าจะเป็นไปไม่ได้” แต่ไม่ได้ให้เกณฑ์วัดผลชัดเจน
ความกังวลใหม่ด้านอาชีพก็เกิดขึ้น: หากไม่ใช้ Token อย่างแพงเพื่อแสดงความสามารถของ AI ก็อาจถูกมองว่าล้าหลัง ความกังวลนี้คล้ายกับในยุคต้นปี 2000 ที่ทุกบริษัทต้องสร้างเว็บไซต์ หรือในยุค 2010 ที่ทุกแบรนด์ต้องมีแอปพลิเคชัน: การนำเทคโนโลยีมาใช้กลายเป็นสัญญาณ การใช้งานเป็นตัวชี้วัดแทนคุณค่าที่แท้จริง
แต่ต่างจากเดิม ต้นทุนในรอบนี้เป็นของจริง เช่น ค่าบริการ AI ต่อเดือน 15,000 ดอลลาร์ การใช้ Token ถึง 210 พันล้านในหนึ่งสัปดาห์ ค่าพลังงานและการเก็บข้อมูลที่เพิ่มขึ้นอย่างต่อเนื่อง การทำให้ Tokenmaxxing เป็นเรื่องไม่ฟรี เมื่อค่าใช้จ่ายสูงขึ้น การ “เผา Token” กับ “ใช้ Token สร้างคุณค่า” ก็กลายเป็นปัญหาทางการเงินมากขึ้น
ราคาขาเข้า Token ยังคงลดต่อไป ไม่มีข้อสงสัย
ความกังวลที่แท้จริงคือ ใครจะใช้ Token ให้คุ้มค่าที่สุดในการทำงานให้สำเร็จ สำหรับทุกคน ตั้งแต่โปรแกรมเมอร์ ไปจนถึงบริษัท และผู้ใช้งานทั่วไป การวัดต้นทุน AI ไม่ใช่ดูแค่ราคาต่อหนึ่งล้าน Token แต่ต้องดูว่าคุ้มค่ากับงานที่ทำจริง ๆ เท่าไหร่
ความแตกต่างระหว่างสองตัวเลขนี้ คือโอกาสทางธุรกิจที่ใหญ่ที่สุดในยุคปัญญาประดิษฐ์ที่ใช้ Token เป็นหน่วยวัดใหม่ และเป็นกับดักด้านต้นทุนที่ลึกซึ้งที่สุด