نموذج جديد من "OpenAI" ينجح في كتابة النصوص داخل الصور

آهات حالمه · الخميس 3:41 ص

شهدت تقنيات توليد الصور بالذكاء الاصطناعي تطوراً ملحوظاً مع إطلاق نموذج Images 2.0 الجديد من "OpenAI"، والذي بات قادراً على إنتاج نصوص داخل الصور بدقة غير مسبوقة، في خطوة قد تُصعّب التمييز بين المحتوى المصنوع بشرياً ونظيره المُولد آلياً.

فحتى وقت قريب، كانت النماذج السابقة تعاني من أخطاء واضحة في كتابة الكلمات، حيث كانت تولد نصوصاً مشوهة أو غير مفهومة، خصوصاً في المهام البسيطة مثل تصميم قوائم الطعام.

أما الآن، فقد أصبح بإمكان النموذج الجديد إنشاء محتوى بصري متكامل — كقائمة طعام لمطعم — يبدو احترافياً وقابلاً للاستخدام الفعلي دون ملاحظة أخطاء تُذكر، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".

ويرجع هذا التحسن إلى تطور آليات توليد الصور، إذ كانت النماذج التقليدية تعتمد على ما يُعرف ب "نماذج الانتشار"، التي تعيد بناء الصورة انطلاقاً من الضوضاء، ما يجعل النصوص داخلها جزءاً هامشياً يصعب إتقانه.

في المقابل، بدأت الأبحاث تتجه نحو نماذج أكثر تقدماً مثل Autoregressive models، التي تعمل بطريقة أقرب إلى نماذج اللغة، ما يحسن دقة التفاصيل الدقيقة مثل النصوص.

ورغم أن "OpenAI" لم تكشف بشكل صريح عن البنية التقنية للنموذج الجديد، إلا أنها أكدت أن Images 2.0 يتمتع بقدرات تفكير متقدمة، تتيح له تنفيذ مهام معقدة مثل البحث، وإنشاء عدة صور من طلب واحد، ومراجعة النتائج قبل تقديمها.

كما أوضحت الشركة أن النموذج الجديد يقدم دعماً محسناً للنصوص غير اللاتينية، بما يشمل لغات مثل اليابانية والكورية والهندية والبنغالية، ما يعزز استخدامه في أسواق عالمية متعددة.

وبفضل هذه القدرات، أصبح بإمكان المستخدمين إنشاء مواد تسويقية عالية الجودة، أو رسوم كوميكس متعددة المشاهد، مع الحفاظ على دقة التفاصيل، مثل الأيقونات وعناصر واجهات المستخدم، وحتى النصوص الصغيرة — وهي من أبرز التحديات التي واجهت النماذج السابقة.

ورغم أن توليد هذا النوع من المحتوى قد يستغرق وقتاً أطول مقارنة بالردود النصية التقليدية، إلا أنه لا يزال يتم خلال دقائق معدودة، حتى في الحالات المعقدة.

ومن المقرر أن يتاح النموذج الجديد لجميع مستخدمي تشات جي بي تي و«Codex»، مع ميزات إضافية للمشتركين المدفوعين، إلى جانب إطلاق واجهة برمجية تحمل اسم «gpt-image-2»، والتي ستُسعّر وفق جودة ودقة الصور المنتجة.

هذا التطور يعكس تسارع المنافسة في مجال الذكاء الاصطناعي، ويضع معياراً جديداً لقدرات توليد الصور، خاصة في ما يتعلق بدمج النصوص بدقة داخل المحتوى البصري.

الشيخ · الخميس 11:53 ص

اهات حالمة

شكراً لك على الطرح

وسيـم · الخميس 4:17 م

عاشت الأيادي

رمااد اانسان · الخميس 5:54 م

يسلمووو على النقل والمجهود
أرق تحية طيبة

آهات حالمه · السبت 4:44 ص

شكرا للمرور الجميل
ارق التحايا وعطر الزهور

اختيارات عامة المحتوى

اختيار لون المنتدى

حدد لون التصميم الذي تريد استخدامه

اختيار خط المنتدى العام

حدد الخط المنتدى الذي تريد استخدامه

Font family

Message layouts

Choose the message layout you want to use

إعادة التخصيصات التي تمت بهذا الستايل

البحث

نموذج جديد من "OpenAI" ينجح في كتابة النصوص داخل الصور

آهات حالمه

دراسة: المستخدمون مستاؤون من روبوتات الدردشة لهذا السبب

نصيحة "الخبير" أثبتت فشلها.. لا توجه روبوت الدردشة بهذه الطريقة

الشيخ

لاتنسى ذكر الله

وسيـم

Well-Known Member

رمااد اانسان

آهات حالمه

الذين يشاهدون الموضوع الآن 1 ( الاعضاء: 0, الزوار: 1 )

المواضيع

المشاركات

الأعضاء

آخر عضو مسجل

About Us

إحصائيات المتصلون

الأعضاء الجدد

Second block title