قدمت OpenAI اختبارات داخلية جديدة لأداء المشروع على مستوى المؤسسات.
أظهرت المعايير العلمية والرياضية درجات أعلى من النماذج السابقة.
تأتي هذه الاعلانات مع قيام OpenAI بعقد صفقات لدمج GPT في الحكومة الأمريكية والشركات.
مركز ديكريبت للفنون والموضة والترفيه.
اكتشف SCENE
بعد أسابيع قليلة من إصدارها الكبير الأخير، تقوم OpenAI بتحويل نموذج ChatGPT الرائد من كونه مجرد مبتكر للمستهلكين إلى قوة مؤسسية لا غنى عنها.
في يوم الخميس، أطلقت الشركة GPT-5.2، وهو نموذج لغة كبير جديد تدعي أنه أسرع وأكثر موثوقية، ومصمم للتعامل مع سير العمل المهني المعقد.
تشير التحديثات إلى أن OpenAI تتجه إلى ما هو أبعد من المساعدة في الواجبات المنزلية والاستفسارات العامة، بهدف دمج تقنيتها كأداة أساسية يومية في عالم الأعمال، كما يتضح من صفقاتها المربحة مع الحكومة الأمريكية وديزني.
قالت OpenAI في بيان: “صممنا GPT‑5.2 لفتح المزيد من القيمة الاقتصادية للناس.” “إنه أفضل في إنشاء الجداول، وبناء العروض التقديمية، وكتابة الشيفرات، وفهم الصور، واستيعاب السياقات الطويلة، واستخدام الأدوات، والتعامل مع مشاريع معقدة ومتعددة الخطوات.”
المعيار الجديد لأتمتة مكان العمل
مع إبراز أداء GPT-5.2، قدمت الشركة معيار تقييم حصري، GDPval، يحاكي المهام عبر 44 مهنة.
وتدعي الشركة أن GPT-5.2 تطابق أو تتفوق على أداء العامل البشري في حوالي 71% من المقارنات.
قالت فيديجي سيمو، الرئيس التنفيذي لتطبيقات OpenAI على منصة X: “على GDPval، يتفوق النموذج التفكيري أو يتساوى مع الخبراء البشر في 70.9% من المهام المهنية الشائعة مثل الجداول، العروض التقديمية، وإنشاء المستندات.” “كما أنه أفضل في الذكاء العام، وكتابة الشيفرات، واستدعاء الأدوات، والرؤية، وفهم السياقات الطويلة، مما يمكنه من فتح المزيد من القيمة الاقتصادية للناس.”
من غير الواضح ما إذا كانت المعايير قد خضعت لمراجعة خارجية، مما يترك لخبراء الصناعة الانتظار للتحقق المستقل من الادعاءات.
التحليل الفني: ثلاثة نماذج لثلاث وظائف
توفر GPT-5.2 عبر طبقات الاشتراك المدفوعة يوم الخميس، مع فتح الوصول إلى واجهة برمجة التطبيقات في نفس اليوم. يمكن للمطورين الآن الاختيار من بين ثلاثة إصدارات مميزة، كل منها محسّن لاحتياجات مهنية مختلفة.
تم تحديد سعر واجهة برمجة التطبيقات بمبلغ 1.75 دولار لكل مليون رمز إدخال و$14 لكل مليون رمز إخراج.
بالإضافة إلى معيار GDPval، أظهرت GPT-5.2 أداء محسّنًا على الاختبارات التقنية المعتمدة، حيث سجلت درجات أعلى على GPQA Diamond و FrontierMath. كما يُقال إنها أظهرت نتائج أكثر موثوقية في المهام demanding مثل التشفير، تحليل البيانات، وتصميم التجارب.
في الإعلان، قدمت الشركة العديد من ردود الفعل الإيجابية من المختبرين الأوائل.
وصول إصدار أكثر كفاءة من الذكاء الاصطناعي في مكان العمل يأتي في بيئة عمل تتسم بالفعل بالتوتر.
يبدو أن المديرين التنفيذيين في الشركات يتسمون بشكل كبير بالتفاؤل، حيث أظهر استطلاع حديث من Just Capital أن 93% من قادة الأعمال يرون أن الذكاء الاصطناعي قوة إيجابية. ومع ذلك، وجدت الدراسة أن ما يقرب من نصف الأمريكيين يتوقعون أن تزيل التكنولوجيا الوظائف، وهو ما يقلق منه المديرون التنفيذيون على ما يبدو بشكل أقل.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
أوبن إيه آي تطلق GPT-5.2 وسط عقود رئيسية موسعة
باختصار
مركز ديكريبت للفنون والموضة والترفيه.
اكتشف SCENE
بعد أسابيع قليلة من إصدارها الكبير الأخير، تقوم OpenAI بتحويل نموذج ChatGPT الرائد من كونه مجرد مبتكر للمستهلكين إلى قوة مؤسسية لا غنى عنها.
في يوم الخميس، أطلقت الشركة GPT-5.2، وهو نموذج لغة كبير جديد تدعي أنه أسرع وأكثر موثوقية، ومصمم للتعامل مع سير العمل المهني المعقد.
تشير التحديثات إلى أن OpenAI تتجه إلى ما هو أبعد من المساعدة في الواجبات المنزلية والاستفسارات العامة، بهدف دمج تقنيتها كأداة أساسية يومية في عالم الأعمال، كما يتضح من صفقاتها المربحة مع الحكومة الأمريكية وديزني.
قالت OpenAI في بيان: “صممنا GPT‑5.2 لفتح المزيد من القيمة الاقتصادية للناس.” “إنه أفضل في إنشاء الجداول، وبناء العروض التقديمية، وكتابة الشيفرات، وفهم الصور، واستيعاب السياقات الطويلة، واستخدام الأدوات، والتعامل مع مشاريع معقدة ومتعددة الخطوات.”
المعيار الجديد لأتمتة مكان العمل
مع إبراز أداء GPT-5.2، قدمت الشركة معيار تقييم حصري، GDPval، يحاكي المهام عبر 44 مهنة.
وتدعي الشركة أن GPT-5.2 تطابق أو تتفوق على أداء العامل البشري في حوالي 71% من المقارنات.
قالت فيديجي سيمو، الرئيس التنفيذي لتطبيقات OpenAI على منصة X: “على GDPval، يتفوق النموذج التفكيري أو يتساوى مع الخبراء البشر في 70.9% من المهام المهنية الشائعة مثل الجداول، العروض التقديمية، وإنشاء المستندات.” “كما أنه أفضل في الذكاء العام، وكتابة الشيفرات، واستدعاء الأدوات، والرؤية، وفهم السياقات الطويلة، مما يمكنه من فتح المزيد من القيمة الاقتصادية للناس.”
من غير الواضح ما إذا كانت المعايير قد خضعت لمراجعة خارجية، مما يترك لخبراء الصناعة الانتظار للتحقق المستقل من الادعاءات.
التحليل الفني: ثلاثة نماذج لثلاث وظائف
توفر GPT-5.2 عبر طبقات الاشتراك المدفوعة يوم الخميس، مع فتح الوصول إلى واجهة برمجة التطبيقات في نفس اليوم. يمكن للمطورين الآن الاختيار من بين ثلاثة إصدارات مميزة، كل منها محسّن لاحتياجات مهنية مختلفة.
تم تحديد سعر واجهة برمجة التطبيقات بمبلغ 1.75 دولار لكل مليون رمز إدخال و$14 لكل مليون رمز إخراج.
بالإضافة إلى معيار GDPval، أظهرت GPT-5.2 أداء محسّنًا على الاختبارات التقنية المعتمدة، حيث سجلت درجات أعلى على GPQA Diamond و FrontierMath. كما يُقال إنها أظهرت نتائج أكثر موثوقية في المهام demanding مثل التشفير، تحليل البيانات، وتصميم التجارب.
في الإعلان، قدمت الشركة العديد من ردود الفعل الإيجابية من المختبرين الأوائل.
وصول إصدار أكثر كفاءة من الذكاء الاصطناعي في مكان العمل يأتي في بيئة عمل تتسم بالفعل بالتوتر.
يبدو أن المديرين التنفيذيين في الشركات يتسمون بشكل كبير بالتفاؤل، حيث أظهر استطلاع حديث من Just Capital أن 93% من قادة الأعمال يرون أن الذكاء الاصطناعي قوة إيجابية. ومع ذلك، وجدت الدراسة أن ما يقرب من نصف الأمريكيين يتوقعون أن تزيل التكنولوجيا الوظائف، وهو ما يقلق منه المديرون التنفيذيون على ما يبدو بشكل أقل.