OpenAI วันอังคารนี้ได้เปิดตัวอย่างเป็นทางการ ChatGPT Images 2.0 ซึ่งไม่เพียงแต่ช่วยยกระดับความแม่นยำของการสร้างข้อความได้อย่างมาก แต่ยังเพิ่มความสวยงามด้านการออกแบบทั้งในงานโปสเตอร์และภาพบุคคลอีกด้วย โมเดลนี้ยังแนะนำ “โหมดการคิด” เป็นครั้งแรก ทำให้การสร้างภาพมีความสามารถในการค้นหาออนไลน์และการออกรูปหลายภาพพร้อมกันได้ ส่งเสริมให้เข้าถึงสถานการณ์การใช้งานเชิงพาณิชย์ได้อย่างครอบคลุม
(Canva ประกาศการบูรณาการเชิงลึกกับ Claude เพื่อให้สามารถแปลงร่างต้นฉบับของ AI เป็นผลงานออกแบบสำเร็จรูป)
จากการเดาสุ่มไปจนถึงเมนูที่สมบูรณ์แบบ: ในที่สุด AI ก็เรียนรู้การสะกดคำ
ย้อนกลับไปเมื่อสองปีก่อน โมเดลการสร้างภาพด้วย AI ยังเป็นที่รู้กันแทบทั่วไปว่ามีจุดอ่อนด้านการสร้างข้อความ ตราบใดที่พรอมต์มีความต้องการเกี่ยวกับตัวหนังสือ ผลลัพธ์มักจะเต็มไปด้วยข้อผิดพลาดในการสะกดอย่างไร้เหตุผลหรือแม้แต่การแต่งขึ้นมาโดยไม่มีที่มา ซึ่งยิ่งรุนแรงในภาษาจีน ญี่ปุ่น เกาหลีที่ไม่ใช่ภาษาอังกฤษ
ภาพตัวอย่างโปสเตอร์ภาษาเกาหลีจากประกาศอย่างเป็นทางการ
ในปัจจุบัน ChatGPT Images 2.0 สามารถสร้างโปสเตอร์โฆษณาที่ผู้ให้บริการนำไปใช้งานได้โดยตรง ข้อความชัดเจนและถูกต้อง นักวิจัยในช่วงไม่กี่ปีที่ผ่านมาได้สำรวจโมเดลแบบ “ย้อนไปสู่ตัวเอง” อย่างจริงจัง (Autoregressive Models) และโครงสร้างรูปแบบใหม่อื่น ๆ โดยตรรกะการทำงาน การเข้าใจตัวอักษร รวมถึงความสามารถในการสร้างและการตรวจสอบได้พัฒนาขึ้นอย่างมีนัยสำคัญ
โหมดการคิดเปิดใช้งาน: ค้นหาออนไลน์ ความสอดคล้องขององค์ประกอบ จัดให้ครบทั้งหมด
การอัปเกรดที่สำคัญที่สุดของ ChatGPT Images 2.0 อยู่ที่ “โหมดการคิด (Thinking Capabilities)” ขณะนี้เปิดให้สำหรับผู้ใช้ที่ชำระเงินของ ChatGPT Plus, Pro, เวอร์ชันเพื่อการพาณิชย์ และเวอร์ชันองค์กร หลังจากเปิดใช้งาน โมเดลสามารถค้นหาข้อมูลบนอินเทอร์เน็ตแบบเรียลไทม์เพื่อช่วยในการสร้างภาพ และยังสามารถสร้างคำอธิบายเชิงภาพที่สอดคล้องกันได้ตามไฟล์ที่ผู้ใช้อัปโหลด พร้อมทั้งทำการตรวจสอบและปรับปรุงเนื้อหาของภาพด้วยตนเองก่อนการส่งออกอย่างเป็นทางการ
ในด้านการสร้างแบบชุดใหญ่ เมื่ออยู่ในโหมดการคิด พรอมต์เดียวสามารถออกรูปภาพได้สูงสุดถึงแปดภาพในครั้งเดียว และแต่ละภาพยังคงรักษารูปลักษณ์ของตัวละคร วัสดุ/รูปแบบของวัตถุ และสไตล์โดยรวมให้สอดคล้องกัน เหมาะสำหรับใช้ในสตอรี่บอร์ดการ์ตูนสำหรับแบ่งช่อง รูปภาพชุดสำหรับโซเชียลมีเดีย ไปจนถึงภาพวางแผนพื้นที่ในงานออกแบบภายในสำหรับทุกมุมมอง
ภาพตัวอย่างสตอรี่บอร์ดการ์ตูนจากประกาศอย่างเป็นทางการ
ด้านความละเอียด โมเดลใหม่รองรับเอาต์พุตสูงสุด 2K และยังเพิ่มตัวเลือกอัตราส่วนภาพหลายแบบตั้งแต่ 3:1 ถึง 1:3 เพื่อตอบโจทย์ความต้องการทางธุรกิจต่าง ๆ ได้ดียิ่งขึ้น
ภาษาในเอเชียได้รับการปรับปรุงอย่างมาก ผู้ใช้จีน ญี่ปุ่น เกาหลีมีสิ่งที่รอคอย!
นอกจากภาษาอังกฤษแล้ว OpenAI ยังชี้เป็นพิเศษว่า Images 2.0 ได้มีการปรับปรุงครั้งใหญ่สำหรับข้อความภาษาในเอเชีย โดยภาษาญี่ปุ่น เกาหลี และจีน ต่างก็มีการพัฒนาอย่างเห็นได้ชัด
บทความทดสอบที่ถูกเผยแพร่และแพร่กระจายในชุมชนเทคโนโลยีของจีนเมื่อไม่กี่วันก่อนก็ยืนยันข่าวดังกล่าว ผู้สร้างคอนเทนต์หลายคนใน Zhihu ได้ทำการทดสอบเปรียบเทียบแบบลงมือทำระหว่าง GPT-Image-2 และคู่แข่งอย่าง Google Nano Banana Pro ครอบคลุมหลายสถานการณ์ เช่น การออกแบบโปสเตอร์ภาษาจีน ภาพปกสำหรับอีคอมเมิร์ซ ภาพสำหรับอินเทอร์เฟซโซเชียลมีเดีย และแผนภูมิข้อมูลแบบเป็นภาพ เป็นต้น
ภาพบทความทดสอบ GPT-Image 2.0 บน Zhihu
ผลการทดสอบชี้ให้เห็นว่า GPT-Image-2 ชนะอย่างชัดเจนในด้านความสวยงามของแบบอักษรจีน ระดับชั้นการจัดวาง และความรู้สึกโดยรวมของงานออกแบบ สไตล์โปสเตอร์ที่สร้างออกมาจะใกล้เคียงกับสื่อเชิงพาณิชย์ของจริงมากกว่า ไม่ใช่ผลแบบเทมเพลตที่มีความรู้สึก “AI” ชัดเจน บทความยังระบุด้วยว่า GPT-Image-2 แสดงความแม่นยำของรายละเอียดที่สูงขึ้นเช่นกันในการจำลองอินเทอร์เฟซ (เช่นภาพหน้าจอของเกมหรือแคปหน้าจอจากแอปแชต) รวมถึงการทำให้ฉากภาพบุคคลจริงออกมาได้อย่างใกล้เคียง
ChatGPT Images 2.0 เปิดให้ใช้งานอย่างเต็มรูปแบบ พร้อม API เปิดตัวพร้อมกัน
ปัจจุบัน ChatGPT Images 2.0 เปิดให้ผู้ใช้ ChatGPT และ Codex ทุกคนใช้งานฟีเจอร์พื้นฐานฟรีตั้งแต่วันอังคารของสัปดาห์นี้ ผู้ใช้แบบชำระเงินสามารถปลดล็อกเอาต์พุตที่มีระดับสูงขึ้นได้ ในเวลาเดียวกัน OpenAI ก็เปิด GPT-Image-2 API พร้อมกันเช่นกัน โดยราคาคิดตามการจัดระดับคุณภาพเอาต์พุตและความละเอียด เพื่อให้มีความยืดหยุ่นในการนำไปรวมเข้ากับธุรกิจฝั่งองค์กรและนักพัฒนา
ควรสังเกตว่า “วันสิ้นสุดของความรู้” ของโมเดลใหม่นี้คือเดือนธันวาคม 2025 ดังนั้นสำหรับพรอมต์การสร้างภาพที่เกี่ยวข้องกับเหตุการณ์ข่าวล่าสุด ความแม่นยำอาจได้รับข้อจำกัดบางประการ นอกจากนี้ ความเร็วในการสร้างองค์ประกอบที่ซับซ้อนก็ไม่สามารถเทียบได้กับการตอบคำถามข้อความแบบทั่วไปแบบเรียลไทม์ แต่ถึงอย่างนั้นก็ยังใช้เวลาเพียงไม่กี่นาที
บทความนี้ ChatGPT Images 2.0 เปิดตัว! ความแม่นยำของการสร้างข้อความดีขึ้นอย่างมาก สร้างโปสเตอร์ทำการตลาดได้อย่างง่ายดาย ถูกเผยแพร่ครั้งแรกใน 鏈新聞 ABMedia。
news.related.news
Meta เปิดตัว AI สำหรับฝึกการติดตามการกดแป้นพิมพ์ของพนักงาน และเครื่องมือติดตามใหม่ท่ามกลางคลื่นการเลิกจ้าง
Claude Opus 4.7 ซ่อนการขึ้นราคา: ตัว Tokenizer ตัวใหม่ทำให้ใช้โทเค็นกับข้อความเดิมมากขึ้น 37–47% แต่ค่าธรรมเนียมไม่เปลี่ยน ใบแจ้งหนี้กลับแพงขึ้น
Canva ประกาศการบูรณาการอย่างลึกซึ้งกับ Claude เพื่อแปลงร่างงาน AI ให้กลายเป็นผลงานออกแบบที่เสร็จสมบูรณ์
โฆษณา ChatGPT เตรียมขยายสู่ออสเตรเลียและนิวซีแลนด์: ผู้ใช้ Free และ Go จะเริ่มใช้งานก่อน แผนแบบชำระเงินยังคงไม่มีโฆษณา