ما هي تقنية التزييف العميق وكيفية إنشائها؟
الشرح الشامل الخاص بك على Deepfakes ولجعلها سهلة باستخدام Faceswap.
لم يعد الذكاء الاصطناعي “ مصطنعًا ” بعد الآن. لقد جعلته هذه الأوقات قريبًا بشكل خطير من البشر.
يمكنه أن يقترح ويكتب ويخلق فنًا ، والآن يبدو ويتحدث مثل الأحياء.
هذه واحدة من أحدث التطورات في هذا المجال يجب أن نستفيد منها. ومع ذلك ، هذا أيضًا أمر يجب أن نحذر منه.
ما هي تقنية التزييف العميق؟
صُنعت كلمة Deepfake من خلال الجمع بين التعلم العميق والتزييف. بعبارات بسيطة ، يمكنك أيضًا افتراض أن هذه الوسائط تم التلاعب بها بخبرة أو تزويرها بشدة.
وفقًا لـ Wikipedia ، يُعرف هذا أيضًا بالوسائط التركيبية التي يتم فيها تعديل صورة أو صوت أو مقطع فيديو موجود لتمثيل شخص آخر تمامًا.
عادةً ما تجعل التزييف العميق الشخصيات المشهورة تبدو وكأنها تقول شيئًا لم تكن لتقوله لولا ذلك.
بناءً على مهارة منشئها ، قد يكون من الصعب للغاية معرفة ما إذا كانت حقيقية أم مزيفة.
كيف تعمل تقنية التزييف العميق؟
ببساطة ، تم استبدال جزء من الفيديو الأصلي (قل وجهًا) بمظهر مزيف مشابه. في مثل هذه الحالة ، يمكن أيضًا تسميته “مبادلة الوجوه” ، كما في فيديو “أوباما” هذا.
ومع ذلك ، لا يقتصر الأمر على الفيديو وحده ، ولدينا صور وصوت مزيف عميق أيضًا (ومن يدري ، تجسيدات VR ذات التزييف العميق في المستقبل القريب).
المصدر: ديزني
تعتمد منهجية العمل وراء هذه الخدع بشكل أساسي على التطبيق والخوارزمية الأساسية.
وفقًا لهذه الورقة البحثية التي أعدتها ديزني ، هناك تقنيات مختلفة ، بما في ذلك أجهزة فك التشفير ، وشبكات الخصومة التوليدية (GANs) ، والتزييف العميق القائم على الهندسة ، وما إلى ذلك.
ومع ذلك ، تتأثر الأقسام التالية بشكل كبير بكيفية عملها مع Facewap. هذا برنامج Deepfake مجاني ومفتوح المصدر يسمح لخوارزميات متعددة بالحصول على النتيجة المتوقعة.
هناك ثلاث عمليات رئيسية لإنشاء التزييف العميق: الاستخراج والتدريب والتحويل.
# 1. اِستِخلاص
يتعلق الأمر بالكشف عن مجال الموضوع محل الاهتمام من عينات الوسائط ، الأصلية وتلك الخاصة بالمبادلة والضغط عليها.
بناءً على إمكانيات الأجهزة ، يمكن أن يكون هناك العديد من الخوارزميات لاختيار الكشف الفعال.
على سبيل المثال ، يحتوي Faceswap على عدد قليل من الخيارات المختلفة للاستخراج والمحاذاة والإخفاء بناءً على كفاءة وحدة المعالجة المركزية أو وحدة معالجة الرسومات.
الاستخراج يحدد ببساطة الوجه في الفيديو العام. محاذاة البقع السمات الحاسمة لأي وجه (عيون ، أنف ، ذقن ، إلخ). وأخيرًا ، يحجب التقنيع العناصر الأخرى للصورة باستثناء منطقة الاهتمام.
يعد الوقت الإجمالي الذي يستغرقه الإخراج مهمًا في تحديد أي خيار ، لأن اختيار خوارزميات كثيفة الاستخدام للموارد على أجهزة متوسطة يمكن أن يؤدي إلى فشل أو وقت طويل جدًا لتقديم نتائج مقبولة.
إلى جانب الأجهزة ، يعتمد الاختيار أيضًا على المعلمات مثل ما إذا كان الفيديو المدخل يعاني من عوائق في الوجه مثل حركات اليد أو النظارات.
عنصر ضروري ، في النهاية ، هو تنظيف (موضح لاحقًا) الناتج ، حيث سيكون لعمليات الاستخراج بعض الإيجابيات الخاطئة.
في النهاية ، يتم تكرار الاستخراج للفيديو الأصلي والمزيف (المستخدم في المبادلة).
# 2. تمرين
هذا هو جوهر صناعة التزييف العميق.
التدريب يدور حول الشبكة العصبية ، والتي تتكون من المشفر ومفكك التشفير. هنا ، يتم تغذية الخوارزميات بالبيانات المستخرجة لإنشاء نموذج للتحويل لاحقًا.
يحول المشفر المدخلات إلى تمثيل متجه لتدريب الخوارزمية على إعادة إنشاء الوجوه من المتجهات ، كما فعلت وحدة فك التشفير.
بعد ذلك ، تقوم الشبكة العصبية بتقييم تكراراتها وتقارنها مع الأصل من خلال تحديد درجة الخسارة. تنخفض قيمة الخسارة هذه بمرور الوقت مع استمرار الخوارزمية في التكرار ، وتتوقف عند قبول المعاينات.
التدريب عملية تستغرق وقتًا طويلاً ، ويتم تحسين المخرجات بشكل عام بناءً على التكرارات التي تقوم بها وجودة بيانات الإدخال.
على سبيل المثال ، يقترح Faceawap ما لا يقل عن 500 صورة لكل منها ، أصلية وللمبادلة. بالإضافة إلى ذلك ، يجب أن تختلف الصور بشكل كبير فيما بينها ، بحيث تغطي جميع الزوايا الممكنة في إضاءة فريدة من نوعها للحصول على أفضل ترفيه.
نظرًا لطول فترة التدريب ، تسمح بعض التطبيقات (مثل Faceswap) بإيقاف التدريب في منتصف الطريق أو المتابعة لاحقًا.
والجدير بالذكر أن الواقعية الضوئية للمخرجات تعتمد أيضًا على كفاءة الخوارزمية والمدخلات. وواحد مرة أخرى مقيد بقدرات الأجهزة.
# 3. تحويل
هذا هو الفصل الأخير في خلق التزييف العميق. تحتاج خوارزميات التحويل إلى فيديو المصدر والنموذج المدرب وملف محاذاة المصدر.
بعد ذلك ، يمكن للمرء تغيير بعض الخيارات المتعلقة بتصحيح الألوان ونوع القناع وتنسيق الإخراج المطلوب وما إلى ذلك.
بعد تكوين هذه الخيارات القليلة ، ما عليك سوى انتظار العرض النهائي.
كما ذكرنا سابقًا ، يعمل تطبيق Faceswap مع العديد من الخوارزميات ، ويمكن للمرء أن يلعب بينها للحصول على تطبيق مبادلة وجه مقبول.
هل هذا كل شيء؟
لا!
كان هذا مجرد تبادل للوجه ، مجموعة فرعية من تقنية التزييف العميق. تبديل الوجه ، مثل المعنى الحرفي ، يستبدل فقط جزءًا من الوجه لإعطاء فكرة خافتة حول ما يمكن أن يفعله التزييف العميق.
للحصول على مقايضة موثوقة ، قد تحتاج أيضًا إلى محاكاة الصوت (المعروف باسم استنساخ الصوت) والجسم بالكامل ، بما في ذلك كل ما يناسب الإطار ، مثل هذا:
إذن ، ما الذي يتم تشغيله هنا؟
ما قد يحدث هو أن مؤلف deepfake قام بتصوير الفيديو بنفسه (كما هو موضح في الثواني القليلة الماضية) ، وقام بمزامنة الحوار مع صوت Morgan Freeman الاصطناعي ، واستبدل رأسه.
بشكل قاطع ، لا يتعلق الأمر فقط بتبديل الوجوه ولكن الإطار بأكمله ، بما في ذلك الصوت.
يمكنك العثور على الكثير من التزييف العميق على YouTube لدرجة أنه يصبح مخيفًا بشأن ما تثق به. وكل ما يتطلبه الأمر هو جهاز كمبيوتر مليء بالطاقة وبطاقة رسومات فعالة للبدء.
ومع ذلك ، يصعب تحقيق الكمال ، وهذا ينطبق بشكل خاص على تقنية التزييف العميق.
بالنسبة إلى التزييف العميق المقنع الذي يمكن أن يضلل أو يبهر الجمهور ، فإنه يستغرق مهارة وبضعة أيام إلى أسابيع من المعالجة لمدة دقيقة أو دقيقتين من مقطع فيديو.
ومن المثير للاهتمام ، أن هذا هو مدى قدرة هذه الخوارزميات حتى الآن. ولكن ما يخبئه المستقبل ، بما في ذلك مدى فعالية هذه التطبيقات على الأجهزة المنخفضة النهاية ، هو شيء جعل الحكومات بأكملها متوترة.
ومع ذلك ، لن نتعمق في تداعياتها المستقبلية. بدلاً من ذلك ، دعنا نتحقق من كيفية القيام بذلك بنفسك للحصول على القليل من المرح.
إنشاء مقاطع فيديو (أساسية) Deepfake
يمكنك التحقق من العديد من التطبيقات في قائمة تطبيقات التزييف العميق هذه لصنع الميمات.
إحداها هي تطبيق Facewap ، والذي سنستخدمه.
هناك بعض الأشياء التي سنتأكد منها قبل المتابعة. أولاً ، يجب أن يكون لدينا فيديو عالي الجودة للهدف يصور مشاعر مختلفة. بعد ذلك ، سنحتاج إلى فيديو مصدر للتبديل إلى الهدف.
بالإضافة إلى ذلك ، أغلق جميع التطبيقات المكثفة لبطاقة الرسوم مثل المتصفحات أو الألعاب قبل متابعة تطبيق Faceswap. هذا صحيح بشكل خاص إذا كان لديك أقل من 2 جيجا بايت من ذاكرة الوصول العشوائي للفيديو (VRAM).
الخطوة 1: استخراج الوجوه
الخطوة الأولى في هذه العملية هي استخراج الوجوه من الفيديو. لهذا ، يتعين علينا تحديد الفيديو الهدف في Input Dir وإدراج Output Dir لعمليات الاستخراج.
بالإضافة إلى ذلك ، هناك عدد قليل من الخيارات ، بما في ذلك الكاشف ، التقويم ، القناع ، إلخ ؛ التفسيرات لكل منها موجودة في الأسئلة الشائعة لبرنامج Faceawap ، وسيكون من الضياع إعادة صياغة المعلومات هنا.
المصدر: FAQwap FAQ
من الجيد بشكل عام مراجعة الوثائق من أجل فهم أفضل ومخرجات مناسبة. ومع ذلك ، هناك نصوص مفيدة في تطبيق Faceswap يمكنك العثور عليها بالمرور فوق الخيار المحدد.
ببساطة ، لا توجد طريقة عالمية ، ويجب على المرء أن يبدأ بأفضل الخوارزميات وأن يشق طريقه بنجاح لإنشاء التزييف العميق المقنع.
للسياق ، استخدمت Mtcnn (كاشف) ومروحة (محاذاة) و Bisenet-Fp (قناع) مع الاحتفاظ بجميع الخيارات الأخرى كما هي.
في الأصل ، جربته مع S3Fd (أفضل كاشف) وبعض الأقنعة الأخرى مجتمعة. ومع ذلك ، فإن 2Gb Nvidia GeForce GTX 750Ti الخاص بي لم يستطع تحمل العبء الأكبر ، وفشلت العملية بشكل متكرر.
أخيرًا ، قمت بتقليل توقعاتي والإعدادات حتى أتمكن من رؤيتها.
إلى جانب تحديد الكاشف المناسب ، وأدوات القناع ، وما إلى ذلك ، هناك عدد قليل من الخيارات في الإعدادات> تكوين الإعدادات التي تساعد على تعديل الإعدادات الفردية بشكل أكبر لمساعدة الأجهزة.
ببساطة ، حدد أقل حجم دفعة ممكنة ، وحجم الإدخال ، وحجم الإخراج ، وتحقق من LowMem ، وما إلى ذلك. هذه الخيارات غير متاحة عالميًا ، وهي تستند إلى قسم معين. بالإضافة إلى ذلك ، تساعد نصوص المساعدة في اختيار أفضل الخيارات.
على الرغم من أن هذه الأداة تقوم بعمل ممتاز في استخراج الوجوه ، يمكن أن تحتوي إطارات الإخراج على أكثر بكثير مما هو مطلوب لتدريب النموذج (تمت مناقشته لاحقًا). على سبيل المثال ، ستحتوي على جميع الوجوه (إذا كان الفيديو يحتوي على أكثر من وجه واحد) وبعض الاكتشافات غير الصحيحة التي لا تحتوي على وجه الهدف على الإطلاق.
هذا يؤدي إلى تنظيف مجموعات البيانات. يمكن لأي شخص التحقق من مجلد الإخراج وحذف نفسه أو استخدام فرز الوجوه للحصول على بعض المساعدة.
سيؤدي استخدام الأداة المذكورة أعلاه إلى ترتيب الوجوه المختلفة بالتسلسل حيث يمكنك تجميع الوجوه الضرورية معًا في مجلد واحد وحذف الباقي.
للتذكير ، سترغب أيضًا في تكرار الاستخراج لمقطع الفيديو المصدر.
الخطوة الثانية: تدريب النموذج
هذه هي أطول عملية لإنشاء تقنية التزييف العميق. هنا ، يشير الإدخال A إلى الوجه المستهدف ، بينما يشير الإدخال B إلى وجه المصدر. إلى جانب ذلك ، فإن النموذج Dir هو المكان الذي سيتم فيه حفظ ملفات التدريب.
هنا الخيار الأكثر أهمية هو المدرب. هناك الكثير مع خيارات القياس الفردية ؛ ومع ذلك ، فإن ما نجح مع أجهزتي هو مدربين Dfl-H128 وخفيف الوزن مع أقل إعدادات التكوين.
التالي هو حجم الدفعة. يقلل حجم الدفعة الأكبر من وقت التدريب الإجمالي ولكنه يستهلك المزيد من VRAM. التكرارات ليس لها تأثير ثابت على المخرجات ، ويجب عليك تعيين قيمة عالية بما يكفي وإيقاف التدريب بمجرد قبول المعاينات.
هناك عدد قليل من الإعدادات ، بما في ذلك إنشاء فاصل زمني بفواصل زمنية محددة مسبقًا ؛ ومع ذلك ، قمت بتدريب النموذج بالحد الأدنى.
الخطوة 3: التبديل إلى الأصل
هذا هو العمل الفذ الأخير في إنشاء deepfake.
لا يستغرق هذا عمومًا الكثير من الوقت ، ويمكنك اللعب بالعديد من الخيارات للحصول على الإخراج المطلوب بسرعة.
كما هو موضح في الصورة أعلاه ، فهذه بعض الخيارات التي يحتاج المرء لاختيارها لبدء التحويل.
تمت مناقشة معظم الخيارات بالفعل ، مثل دليل الإدخال والإخراج ، ودليل النموذج ، وما إلى ذلك. أحد الأشياء المهمة هو المحاذاة التي تشير إلى ملف المحاذاة (.fsa) للفيديو الهدف. يتم إنشاؤه في دليل الإدخال أثناء الاستخراج.
يمكن ترك حقل التوافقات فارغًا إذا لم يتم نقل هذا الملف المحدد. خلاف ذلك ، يمكن للمرء تحديد الملف والانتقال إلى خيارات أخرى. ومع ذلك ، تذكر تنظيف ملف المحاذاة إذا قمت بتنظيف عمليات الاستخراج مسبقًا.
لهذا ، تكمن هذه الأداة الصغيرة في Tools> Alignments.
ابدأ بتحديد إزالة الوجوه في قسم الوظيفة ، وحدد ملف المحاذاة الأصلي ومجلد الوجوه الهدف الذي تم تنظيفه ، وانقر فوق التوافقات في أسفل اليمين.
سيؤدي هذا إلى إنشاء ملف محاذاة معدل ، يتوافق مع مجلد الوجوه المحسّن. من فضلك تذكر أننا بحاجة إلى هذا للفيديو الهدف ، الذي نريد التبديل إليه.
تتضمن بعض التكوينات الأخرى ضبط اللون ونوع القناع. يحدد ضبط اللون مزج القناع ، ويمكنك تجربة القليل منها ، والتحقق من المعاينة ، وتحديد الخيار الأمثل.
نوع القناع أكثر أهمية. هذا ، مرة أخرى ، يعتمد على توقعاتك والأجهزة المتاحة. عادة ، تحتاج أيضًا إلى مراعاة خصائص إدخال الفيديو. على سبيل المثال ، يعمل Vgg-Clear بشكل جيد مع الوجوه الأمامية بدون عوائق ، بينما يمكن لـ Vgg-Obstructed أيضًا القيام بالعوائق ، مثل إيماءات اليد والنظارات وما إلى ذلك.
بعد ذلك ، يقدم الكاتب بعض الخيارات بناءً على الإخراج الذي تريده. على سبيل المثال ، حدد Ffmpeg لتصيير الفيديو.
بشكل عام ، مفتاح النجاح في التزييف العميق هو معاينة بعض المخرجات والتحسين وفقًا لتوفر الوقت وفعالية الجهاز.
تطبيقات Deepfake
هناك تطبيقات جيدة وسيئة وخطيرة للتزييف العميق.
تتمثل الأشياء الجيدة في إعادة إنشاء دروس التاريخ من خلال تلك التي كانت موجودة بالفعل من أجل مشاركة أكبر.
بالإضافة إلى ذلك ، يتم استخدامها من قبل منصات التعلم عبر الإنترنت لإنشاء مقاطع فيديو من النصوص.
لكن صناعة السينما ستكون من أكبر المستفيدين. هنا ، سيكون من السهل تخيل القائد الفعلي الذي يؤدي الأعمال المثيرة ، حتى عندما يكون الشخص البهلواني يخاطر بحياته. بالإضافة إلى ذلك ، سيكون صنع أفلام متعددة اللغات أسهل من أي وقت مضى.
القدوم إلى الأشرار ، للأسف ، هناك الكثير. أكبر تطبيق للتزييف العميق حتى الآن ، في واقع الأمر ، 96 ٪ (وفقًا لتقرير Deeptrace هذا) ، موجود في صناعة الإباحية لمبادلة وجوه المشاهير بممثلين إباحيين.
بالإضافة إلى ذلك ، يتم أيضًا استخدام تقنية التزييف العميق كسلاح ضد النساء “القياسيات” غير المشهورات. عادةً ما يكون لدى هؤلاء الضحايا صور أو مقاطع فيديو عالية الجودة في ملفاتهم الشخصية على وسائل التواصل الاجتماعي والتي تُستخدم لإنشاء التزييف العميق.
تطبيق مخيف آخر هو التصيد الصوتي ، ويعرف أيضًا باسم التصيد الصوتي. في إحدى هذه الحالات ، قام الرئيس التنفيذي لشركة مقرها المملكة المتحدة بتحويل 243 ألف دولار بناءً على أوامر “الرئيس التنفيذي” لشركتها الألمانية الأم ، ليكتشف لاحقًا أنها كانت في الواقع مكالمة هاتفية مزيفة.
لكن الأمر الأكثر خطورة هو إثارة الحروب أو المطالبة بالاستسلام. شهدت المحاولة الأخيرة للرئيس الأوكراني ، فولوديمير زيلينسكي ، مطالبة قواته وشعبه بالاستسلام في الحرب المستمرة. ومع ذلك ، تم الكشف عن الحقيقة هذه المرة من خلال الفيديو الفرعي.
بشكل قاطع ، هناك العديد من تطبيقات التزييف العميق ، وقد بدأت للتو.
هذا يقودنا إلى سؤال المليون دولار …
هل التزييف العميق قانوني؟
هذا يعتمد بشكل كبير على الإدارة المحلية. على الرغم من أن القوانين المحددة جيدًا ، بما في ذلك ما هو مسموح به وما هو غير مسموح به ، لم يتم رؤيتها بعد.
ومع ذلك ، ما هو واضح هو أنه يعتمد على ما تستخدمه من أجل التزييف العميق – النية. لا يكاد يكون هناك أي ضرر إذا كنت تنوي ترفيه أو تعليم أي شخص دون الإخلال بهدف التبادل.
من ناحية أخرى ، يجب أن يعاقب القانون على التطبيقات الخبيثة ، بغض النظر عن الاختصاص القضائي. هناك منطقة رمادية أخرى وهي انتهاك حقوق الطبع والنشر والتي تحتاج إلى دراسة مناسبة.
ولكن للتكرار ، يجب عليك مراجعة الهيئات الحكومية المحلية حول تطبيقات التزييف القانوني العميق.
ترقب!
يستفيد Deepfkaes من الذكاء الاصطناعي لجعل أي شخص يقول الأشياء.
لا تثق في أي شيء تراه على الإنترنت هو النصيحة الأولى التي يجب أن نتصرف بناءً عليها. هناك أطنان من المعلومات الخاطئة ، وفعاليتها في ازدياد.
ونظرًا لأنه سيكون من الأسهل فقط إنشاءها ، فقد حان الوقت لنتعلم كيفية اكتشاف التزييف العميق.