ตามรายงานของ OpenAI บริษัทระบุสาเหตุรากเหง้าของปัญหา “ก๊อบลิน” ที่รุมหลอกหลอนโมเดล GPT ตั้งแต่ GPT-5.1 เป็นต้นมา สัญญาณรางวัลที่ใช้เพื่อเสริมบุคลิก “Nerdy” กระตุ้นให้เกิดผลลัพธ์ที่มีการอ้างอิงถึงสิ่งมีชีวิตในตำนาน โดย 76.2% ของชุดข้อมูลฝึกแสดงอคตินี้ บุคลิก Nerdy คิดเป็นเพียง 2.5% ของคำตอบทั้งหมดของ ChatGPT แต่กลับมีส่วนทำให้เกิดการกล่าวถึงก๊อบลิน 66.7% โดยจำนวนครั้งพุ่งขึ้น 3,881% จาก GPT-5.2 ถึง GPT-5.4
OpenAI ลบบุคลิก Nerdy ในเดือนมีนาคม กำจัดสัญญาณรางวัลที่มีอคติ และกรองข้อมูลการฝึกด้วย บริษัททยอยเพิ่มคำสั่งยับยั้งในพรอมป์ระดับผู้พัฒนาของ GPT-5.5 ใน Codex การสืบสวนดังกล่าวนำไปสู่การพัฒนาเครื่องมือตรวจสอบพฤติกรรมของโมเดลชุดใหม่