أداة تخصيص استايل المنتدى
إعادة التخصيصات التي تمت بهذا الستايل

- الاعلانات تختفي تماما عند تسجيلك
- عضــو و لديـك مشكلـة فـي الدخول ؟ يــرجى تسجيل عضويه جديده و مراسلـة المديــر
او كتابــة مــوضـــوع فــي قســم الشكـاوي او مـراسلــة صفحتنـا على الفيس بــوك

نموذج جديد من "OpenAI" ينجح في كتابة النصوص داخل الصور

آهات حالمه

طاقم الإدارة
LV
1
 
إنضم
5 أغسطس 2019
المشاركات
98,900
مستوى التفاعل
15,586
النقاط
187
الاوسمة
1
1776904860427.png


شهدت تقنيات توليد الصور بالذكاء الاصطناعي تطوراً ملحوظاً مع إطلاق نموذج Images 2.0 الجديد من "OpenAI"، والذي بات قادراً على إنتاج نصوص داخل الصور بدقة غير مسبوقة، في خطوة قد تُصعّب التمييز بين المحتوى المصنوع بشرياً ونظيره المُولد آلياً.

فحتى وقت قريب، كانت النماذج السابقة تعاني من أخطاء واضحة في كتابة الكلمات، حيث كانت تولد نصوصاً مشوهة أو غير مفهومة، خصوصاً في المهام البسيطة مثل تصميم قوائم الطعام.


أما الآن، فقد أصبح بإمكان النموذج الجديد إنشاء محتوى بصري متكامل — كقائمة طعام لمطعم — يبدو احترافياً وقابلاً للاستخدام الفعلي دون ملاحظة أخطاء تُذكر، بحسب تقرير نشره موقع "تك كرانش" واطلعت عليه "العربية Business".



ويرجع هذا التحسن إلى تطور آليات توليد الصور، إذ كانت النماذج التقليدية تعتمد على ما يُعرف ب "نماذج الانتشار"، التي تعيد بناء الصورة انطلاقاً من الضوضاء، ما يجعل النصوص داخلها جزءاً هامشياً يصعب إتقانه.

في المقابل، بدأت الأبحاث تتجه نحو نماذج أكثر تقدماً مثل Autoregressive models، التي تعمل بطريقة أقرب إلى نماذج اللغة، ما يحسن دقة التفاصيل الدقيقة مثل النصوص.

ورغم أن "OpenAI" لم تكشف بشكل صريح عن البنية التقنية للنموذج الجديد، إلا أنها أكدت أن Images 2.0 يتمتع بقدرات تفكير متقدمة، تتيح له تنفيذ مهام معقدة مثل البحث، وإنشاء عدة صور من طلب واحد، ومراجعة النتائج قبل تقديمها.

كما أوضحت الشركة أن النموذج الجديد يقدم دعماً محسناً للنصوص غير اللاتينية، بما يشمل لغات مثل اليابانية والكورية والهندية والبنغالية، ما يعزز استخدامه في أسواق عالمية متعددة.

وبفضل هذه القدرات، أصبح بإمكان المستخدمين إنشاء مواد تسويقية عالية الجودة، أو رسوم كوميكس متعددة المشاهد، مع الحفاظ على دقة التفاصيل، مثل الأيقونات وعناصر واجهات المستخدم، وحتى النصوص الصغيرة — وهي من أبرز التحديات التي واجهت النماذج السابقة.


ورغم أن توليد هذا النوع من المحتوى قد يستغرق وقتاً أطول مقارنة بالردود النصية التقليدية، إلا أنه لا يزال يتم خلال دقائق معدودة، حتى في الحالات المعقدة.

ومن المقرر أن يتاح النموذج الجديد لجميع مستخدمي تشات جي بي تي و«Codex»، مع ميزات إضافية للمشتركين المدفوعين، إلى جانب إطلاق واجهة برمجية تحمل اسم «gpt-image-2»، والتي ستُسعّر وفق جودة ودقة الصور المنتجة.

هذا التطور يعكس تسارع المنافسة في مجال الذكاء الاصطناعي، ويضع معياراً جديداً لقدرات توليد الصور، خاصة في ما يتعلق بدمج النصوص بدقة داخل المحتوى البصري.
 

آهات حالمه

طاقم الإدارة
LV
1
 
إنضم
5 أغسطس 2019
المشاركات
98,900
مستوى التفاعل
15,586
النقاط
187
الاوسمة
1
شكرا للمرور الجميل
ارق التحايا وعطر الزهور
 

الذين يشاهدون الموضوع الآن 1 ( الاعضاء: 0, الزوار: 1 )