24/04/2026
⚙️ التقنيات الأساسية الموثقة
الميزة الجوهرية التي انفردت بها OpenAI هي مفهوم "التفكير" (Thinking)، المعتمد على دمج بنية سلسلة من الأفكار (Chain-of-Thought) في نموذج الصور. هذا يسمح للنظام بالبحث في الإنترنت لفهم السياق والتخطيط للتكوين البصري والعلاقات المكانية والتحقق من مخرجاته قبل رسمها. المصادر المتاحة لا تذكر تقنية "Adaptive Scene Encoding" كخاصية للنموذج الجديد.
📊 تقييمات الأداء
أظهرت النتائج الأولية تفوقاً كبيراً لنموذج GPT Image 2 في التقييمات المختلفة:
· حقق النموذج المركز الأول في قوائم Image Arena (ساحة اختبار الصور) بفارق كبير، حيث حصل على درجة 1512 متفوقاً على أقرب منافسيه Nano Banana 2
· في تقييمات DrawBench، أظهرت الاختبارات المستقلة ارتفاع دقة النصوص داخل الصور لتصل إلى ما يقرب من 99% عبر العديد من اللغات مثل الصينية واليابانية والهندية والبنغالية
· تحسن الالتزام بالتعليمات (Prompt Following) بنسبة 34% مقارنةً بالجيل السابق، مع قدرة أفضل على التعامل مع العلاقات المكانية بدقة
🖼️ التحسينات الملحوظة
· النصوص والخطوط: قدرة غير مسبوقة على كتابة نصوص واضحة ومقروءة داخل الصور، حتى باللغات غير اللاتينية، مما يجعلها مناسبة للاستخدام التجاري.
· التركيب البصري: تحسين كبير في وضع الأشياء في أماكنها الصحيحة مكانياً، مما يقلل من الأخطاء الشائعة.
· التعامل مع التعليمات المعقدة: قدرة أفضل على فهم وتنفيذ التعليمات الطويلة مع الحفاظ على اتساق الشخصيات والأسلوب عبر عدة صور تصل إلى 8 صور في الأمر الواحد. تاريخ الإصدار: تم الإعلان رسمياً عن النموذج الجديد في 21 أبريل 2026 (وليس 24 أبريل) وأُتيح للمستخدمين يوم 22 أبريل.
· الاسم الرسمي: الاسم الرسمي الذي تستخدمه OpenAI هو "ChatGPT Images 2.0"، بينما "gpt-image-2" هو الاسم التقني للمطورين عبر واجهة برمجة التطبيقات (API).
· تفاصيل البحث: لم يتم العثور على أي ورقة بحثية منشورة على arXiv أو أي مصدر موثوق يثبت أن اسم التقنية الأساسية هو "Adaptive Scene Encoding".
· مدى التوفّر: النموذج متاح حالياً لجميع المستخدمين على ChatGPT وCodex (بما في ذلك الفئة المجانية بنسخة Instant)، وليس لمشتركي Plus وPro فقط. لم يُعلن رسمياً عن موعد إتاحته للفئة المجانية في الربع الثالث.