لو أنت صانع محتوى أو مصمم جرافيك معتمد على الذكاء الاصطناعي، فأكيد المحطتين الأساسيين بتوعك هما ChatGPT و Gemini.
الخناقة بين الاتنين دول مابتخلصش في كتابة المقالات أو البرمجة، بس الخناقة الحقيقية واللي فيها كلام بفلوس هي: “مين فيهم الأقوى في توليد وصناعة الصور الاحترافية؟”.
النهارده هنحط ChatGPT (بمحرك DALL-E) في مواجهة مباشرة مع Gemini (بمحرك Imagen المتطور) من واقع الفرك والتجارب اليومية.
هقولك بلغة السوق مميزات وعيوب كل واحد، وإزاي تستغل التريكات اللي في ده وده، ومين اللي تدفع فيه فلوسك وأنت مغمض ومطمن للنتيجة.
1. محرك ChatGPT (دقة في فهم الكلام.. بس جودته كارتونية)
شات جي بي تي بيعتمد في توليد الصور على محرك DALL-E. الميزة المرعبة هنا هي “الفهم الذكي”؛ يعني أنت لو كتبت برومبت طويل وملعك وفيه تفاصيل كتير داخلة في بعضها، المحرك بيقعد يفصص كلامك ويطلعلك كل عنصر في مكانه بالظبط.
- المميزات: جبار في دمج النصوص والكتابة جوه الصور! لو عايز لوجو أو كارت معايدة مكتوب عليه كلمة بالإنجليزية واضحة، هيطلعها قريبة جداً للصح ومن غير لغبطة حروف. كمان ميزة التعديل الذكي (Inpainting) جوه الشات بتخليك تضغط على حتة في الصورة وتقوله غيرها في ثواني.
- العيوب: النتيجة أوقات كتير بتميل لـ “الاستايل الكارتوني البلاستيكي”. الصور بتطلع ناعمة زيادة عن اللزوم وتفتقد التفاصيل الواقعية الحقيقية (Photorealism) اللي بنشوفها في محركات تانية. تحس إن الشغل طالع “ديجيتال آرت” مش صورة حقيقية متصورة بكاميرا سينما.
2. محرك Gemini (الواقعية الساحرة والإضاءة السينمائية)
جيميناي من جوجل بيعتمد على محركات Imagen المتقدمة، وهنا بقى اللعبة بتختلف تماماً في الكواليتي ونقاء الصورة. جوجل ركزت إن الصورة تطلع كأنها لقطة حقيقية متعالجة في ستوديو محترف.
- المميزات: ملك الواقعية والإضاءة (Cinematic Lighting) والخامات (Textures). لما بتطلب منه صورة بشرية، بيطلع ملامح الوش حية، الجلد فيه مسام طبيعية، والظلال متوزعة بعبقرية مع البيئة المحيطة سواء ذهب أو قماش. الـ Style بتاعه فخم جداً ومريح للعين البشرية من أول نظرة.
- العيوب: أوقات بيبقى عنيد في فهم الأوامر الطويلة والمعقدة اللي فيها تفاصيل كتيرة مرصوصة ورا بعضها، وبيحتاج إنك تكتبله البرومبت بأسلوب مرتب ومباشر (Direct Prompting) عشان ما يتوهش منك ويطير نص العناصر.
إزاي تستخدم ده وإزاي تستخدم ده علشان تاخد أعلى كواليتي؟
الصنايعي الشاطر في السوق مابيقفش عند أداة واحدة، هو بيبوظ دماغ السيرفرات عشان ياخد مصلحته. إليك الطريقة الذكية لتشغيل الاتنين:
- طريقة تشغيل ChatGPT الصح: استخدمه لما تكون بتعمل فكرة “معقدة جداً” ومحتاجة ترتيب عناصر دقيق، أو لما تكون عايز صورة فيها نصوص مكتوبة وعلامات تجارية واضحة، أو تصاميم كارتونية ستايل بيكسار أو أنمي.
- طريقة تشغيل Gemini الصح: ارمي فيه الأفكار اللي محتاجة فخامة وواقعية (Photorealistic). زي كروت المعايدة الإسلامية الثقيلة، تصاميم الـ 3D Clay، بورتريهات الأشخاص، أو لو عايز خلفية سينمائية فخمة تبهر بيها العميل وتدمج عليها شغلك بعد كده.
جدول المقارنة السريع والنهائي من واقع التجربة
| وجه المقارنة والتكنيكال | محرك ChatGPT (DALL-E) | محرك Gemini (Imagen) | مين اللي يكسب الجولة؟ |
|---|---|---|---|
| فهم الأوامر الطويلة والمعقدة | خارق ويفهم أدق التفاصيل | ممتاز بس محتاج أوامر مباشرة | ChatGPT |
| الواقعية الفوتوغرافية (الجلد والظلال) | متوسطة وتميل للكارتون والبلاستيك | خرافية وكأنها متصورة بكاميرا احترافية | Gemini |
| دقة الكتابة والنصوص جوه الصورة | قوية جداً ونادراً ما تغلط | ممتازة وبتتطور بسرعة | ChatGPT |
| السرعة وسهولة التعديل على الفريم | سريع وفيه أداة تحديد ذكية | طلقة ويديك خيارات متعددة | تعادل |
شوف ببنفسك وقارن فرق النتيجه مابين الاتنين في عمل الصور👇👇


أخطاء بيقع فيها المصممين في خناقة المحركات دي
عشان السيرفر ما يطلعلكش صورة “ضربة” أو ملامحها مشوهة، تجنب تماماً التلات حاجات دول:
- كتابة برومبت معقد لـ Gemini: بلاش ترص 50 عنصر في برومبت واحد مع جيميناي. اديله الفكرة الأساسية والخلفية والإضاءة، وسيبه هو يوزع التفاصيل الإبداعية بخوارزميته.
- طلب واقعية مطلقة من ChatGPT بدون توجيه: لو كتبت في شات جي بي تي “صورة حقيقية” وسكت، هيطلعها بلاستيك. لازم تغذيه بكلمات الكاميرات والعدسات زي
Shot on 35mm lens, shutter speed 1/250, cinematic grainy textureعشان تجبره يهرب من الاستايل الكارتوني. - تجاهل أبعاد الصورة: اتأكد دايماً وأنت بتطلب من الاتنين إنك تحدد الأبعاد المناسبة لشغلك (زي أبعادنا الثابتة 4:5 للطولي)، عشان تفاصيل الوش والجسم ما تمطش وتطلع مشوهة.
الخلاصة.. مين الأحسن فيهم وتعتمد عليه؟
مفيش حاجة اسمها أداة كاملة، الصياعة كلها في “تكامل الأدوات”.
لو أنت شغال في كروت المعايدة، البوستر الإعلاني الفخم، وشغل الثري دي اللي محتاج خامات حية تبان حقيقية وبتشد العين فوراً، فـ Gemini هو الملك اللي هيكسبك رضا الزباين وبوتات أدسنس.
أما لو شغلك قايم على القصص، الكوميكس، الجرافيك ديزاين اللي فيه نصوص وكتابة كتير، فـ ChatGPT هيبقى صديقك الصدوق.
شاركوني في التعليقات تحت، إيه أكتر محرك بتعتمدوا عليه في توليد صوركم؟ ومين اللي نتايجه بتبهركم أكتر؟
تمت الكتابة بواسطة فريق مدونة خد فكرة مع moka
by mokaAi

