مقابل MidJourney مقابل Stable Diffusion مقابل Bing Image Creator

يعمل الذكاء الاصطناعي على تغيير عالم الفن بطرق رائعة. أحد التطبيقات الرائعة للذكاء الاصطناعي في قطاع الفن هو استخدام المولدات الفنية الوصفية. تتمتع هذه المولدات بالقدرة على فحص الصور وتفسيرها وإنشاء قطع فنية جديدة تمامًا بناءً على تحليلها.
في هذه المقالة ، نناقش ثلاثة مولدات فنية للذكاء الاصطناعي: MidJourney و Stable Diffusion و Microsoft Bing Image Creator ، ومن بين الثلاثة التي تأتي في المقدمة في توليد أفضل النتائج بناءً على المطالبات.
ميدجورني
MidJourney ، التي أسسها David Holz ، هي منشئ فني للذكاء الاصطناعي يستخدم التعلم الآلي لتحديد الأنماط والميزات في الأعمال الفنية الحالية ، والتي يمكن استخدامها بعد ذلك لإنشاء قطع جديدة.
دخلت MidJourney الإصدار التجريبي المفتوح في 12 يوليو 2022. قبل إطلاق MidJourney ، شارك هولز في تأسيس Leap Motion ، وهي شركة ناشئة غيرت واجهات المستخدم من خلال استخدام التقاط الفيديو وإيماءات اليد. في عام 2019 ، باع Leap Motion إلى Ultrahaptics.
مع اكتساب MidJourney لشعبية ، شارك هولز رؤيته حول التكنولوجيا وتأثيرها على الفن والمجتمع. يعتبر هولز الفنانين عملاء لـ MidJourney ، وليسوا منافسين ، ويعتقد أن المنصة يمكن أن تسهل قدرًا أكبر من الإبداع والتجريب في مرحلة التفكير.
ومع ذلك ، هناك مخاوف بشأن انتهاك محتمل لحقوق الطبع والنشر من مجموعة تدريب MidJourney ، والتي قد تتضمن أعمالًا محمية بحقوق الطبع والنشر من فنانين آخرين.
يؤكد هولز أن MidJourney مصمم لتعزيز القدرات البشرية بدلاً من استبدالها. وشبهها بالسيارات ، موضحًا أنه لمجرد أن السيارات أسرع من البشر ، فهذا لا يعني أننا يجب أن نقطع أرجلنا.
باستخدام توليد صور الذكاء الاصطناعي في MidJourney ، يمكن للفنانين استكشاف إمكانيات جديدة وتوليد العديد من الأفكار قبل إنشاء أعمالهم الخاصة.
انتشار مستقر
يعد Stable Diffusion نموذجًا مفتوح المصدر للتعلم الآلي يمكنه إنشاء صور من النص أو تعديل الصور بناءً على النص أو ملء التفاصيل على الصور منخفضة الدقة أو منخفضة التفاصيل. لقد تم تدريبه على مليارات الصور ويمكن أن ينتج عنه نتائج مماثلة لتلك التي قد تحصل عليها من DALL-E 2 و MidJourney.
عماد مستقي ، المؤسس والرئيس التنفيذي لشركة Stability AI ، هي الشركة المسؤولة عن Stable Diffusion. Stable Diffusion هو نموذج انتشار كامن طورته مجموعة CompVis في LMU Munich ، وقد صممه Patrick Esser و Robin Rombach ، اللذان قاما سابقًا بإنشاء بنية نموذج الانتشار الكامن التي استخدمها Stable Diffusion.
أدى التعاون بين Stability AI و CompVis LMU و Runway و EleutherAI و LAION إلى جعل Stable Diffusion متاحًا للجمهور.
يمكن نشر الانتشار المستقر على منصات مختلفة ، بما في ذلك أجهزة Windows و Apple. يمكن أن يؤدي استخدام النشر على الجهاز في أحد التطبيقات إلى حماية خصوصية المستخدم ، وهو ما يُفضل على النهج القائم على الخادم.
برنامج Microsoft Bing Image Creator
كشفت Microsoft النقاب عن أداة جديدة تسمى Bing Image Creator ، والتي تمكن المستخدمين من إنشاء صورهم الخاصة مباشرة داخل Microsoft Edge. أصدرت الشركة مجموعة من أدوات المبدعين المصممة لإشعال الإبداع والتعبير عن الذات. تتيح الأداة للمستخدمين صياغة صور مخصصة لمشاركة تحديثات حياتهم أو لأي غرض آخر قد يحتاجون إليه.
يمكن للمستخدمين الوصول بسهولة إلى Image Creator من الشريط الجانبي لـ Microsoft Edge. اتخذت Microsoft إجراءات استباقية لضمان استخدام الأداة بمسؤولية وعدم تسهيل انتشار المحتوى المسيء.
وضعت الشركة سياسة محتوى تحظر استخدام Image Creator في حالات معينة ، ويمكن للمستخدمين الإبلاغ عن أي انتهاكات لهذه السياسة. علاوة على ذلك ، طبقت Microsoft تقنية لمعالجة التحيزات المحتملة التي قد تنشأ في تقنية الصور التوليدية.
في هذه المقالة ، سنشرع في رحلة لتقييم نتائج كل منشئ صور وصفي يعمل بالذكاء الاصطناعي عند مطالبتك بمطالبات نصية متطابقة.
موجه 1: سانتا كلوز الحديثة على مزلقة تجرها حيوانات الرنة في يوم مشمس دافئ على طريق سريع
الموجه الثاني: لقطة مقرّبة لحيوان بعيون كبيرة ، وتلتقط براءته وجاذبيته
الرسالة الثالثة: إن رائد الفضاء البشري الذي يلعب في الهبوط على كوكب جديد مرحب به من قبل مخلوقات فضائية معادية تسحب أسلحتها
موجه 4: الفن التجريدي الحديث لغلاف كتاب لرواية مقرها في مدينة نيويورك بألوان زاهية جريئة
الموجه الخامس: رجل يقرر بين طبقين – أحدهما به بيتزا والآخر به تشيز برجر
موجه 6: محارب جريح يمتطي حصانه على جبل ثلجي وبيده سيف
موجه 7: صورة مجردة باستخدام ظلال مختلفة توضح حركة وتدفق المياه
الموجه الثامن: سمك السلمون في النهر مع الأشجار الخضراء المورقة في الخلفية
الرسالة التاسعة: كوب من الماء على منضدة مع عصر ليمونة فيه باليد
الموجه العاشر: منظر الأفق في الصحراء من وجهة نظر الناس الذين يركبون فيلًا فيها
موجه 11: غابة حيث تنمو النقود الورقية على الأشجار وتصنع الطيور من العملات المعدنية
موجه 12: وعاء من الرامين ، تظليل سل ، إضاءة مسائية ، صورة واقعية
الرسالة 13: إيلون ماسك فقير وعاطل عن العمل
حكم
عند تقييم مخرجات MidJourney و Stable Diffusion و Bing Image Creator ، من الواضح أنه لا يوجد فائز نهائي.
يفسر كل مولد المطالبات بطريقة مميزة ، مع وجود أوجه تشابه في مخرجات Bing Image Creator و MidJourney. يكون الانتشار المستقر فعالًا عندما يكون للمطالبات أوصاف واضحة ولكنها غالبًا ما تأخذ الكلمات بشكل حرفي للغاية. على الرغم من نجاح MidJourney و Bing Image Creator بشكل عام ، إلا أنهما ينتجان أحيانًا نتائج لا تتوافق مع المطالبات.
والجدير بالذكر أن Bing Image Creator يتوخى الحذر في توليد أي مخرجات مسيئة أو تحريضية ، ويصدر رسالة تحذير عندما يُطلب منك إنشاء صورة لإيلون ماسك الفقير والعاطل عن العمل. إن اعتماد Microsoft لمثل هذه الإجراءات الوقائية جدير بالثناء.
في غضون ذلك ، ولّدت خبرة شبكة MidJourney العصبية صورة إيلون ماسك المعوز واليائس. ومن ثم ، يمكن استنتاج أن كل مولد سوف يلبي احتياجات قاعدة المستخدمين الخاصة به.