شرح التعلم الجماعي بأبسط المصطلحات الممكنة

يمكن أن تساعدك مجموعة التعلم على اتخاذ قرارات أفضل وحل العديد من تحديات الحياة الواقعية من خلال الجمع بين القرارات من عدة نماذج.
يواصل التعلم الآلي (ML) توسيع أجنحته في قطاعات وصناعات متعددة ، سواء كان ذلك في التمويل أو الطب أو تطوير التطبيقات أو الأمان.
سيساعدك تدريب نماذج ML بشكل صحيح على تحقيق نجاح أكبر في عملك أو دورك الوظيفي ، وهناك طرق مختلفة لتحقيق ذلك.
في هذه المقالة ، سأناقش التعلم الجماعي ، وأهميته ، وحالات استخدامه ، وتقنياته.
ابقوا متابعين!
ما هو التعلم الجماعي؟
في التعلم الآلي والإحصاء ، يشير مصطلح “المجموعة” إلى الطرق التي تولد فرضيات مختلفة أثناء استخدام متعلم أساسي مشترك.
التعلم الجماعي هو نهج التعلم الآلي حيث يتم إنشاء نماذج متعددة (مثل الخبراء أو المصنفين) بشكل استراتيجي ودمجها بهدف حل مشكلة حسابية أو عمل تنبؤات أفضل.
يسعى هذا النهج إلى تحسين التنبؤ ، وتقريب الوظيفة ، والتصنيف ، وما إلى ذلك ، وأداء نموذج معين. يتم استخدامه أيضًا للتخلص من إمكانية اختيار نموذج فقير أو أقل قيمة من بين العديد من النماذج. لتحقيق أداء تنبؤي محسن ، يتم استخدام العديد من خوارزميات التعلم.
أهمية التعلم الجماعي في ML
في نماذج التعلم الآلي ، هناك بعض المصادر مثل التحيز والتباين والضوضاء التي قد تسبب أخطاء. يمكن أن يساعد التعلم الجماعي في تقليل هذه المصادر المسببة للأخطاء وضمان استقرار ودقة خوارزميات تعلم الآلة.
فيما يلي سبب استخدام التعلم الجماعي في سيناريوهات مختلفة:
اختيار المصنف الصحيح
يساعدك تعليم المجموعة على اختيار نموذج أو مصنف أفضل مع تقليل المخاطر التي قد تنتج بسبب سوء اختيار النموذج.
هناك أنواع مختلفة من المصنفات المستخدمة لمشاكل مختلفة ، مثل آلات ناقلات الدعم (SVM) ، والمدرك متعدد الطبقات (MLP) ، ومصنفات بايز الساذجة ، وأشجار القرار ، وما إلى ذلك. بالإضافة إلى ذلك ، هناك عمليات إدراك مختلفة لخوارزميات التصنيف التي تحتاج إلى اختيارها . يمكن أن يكون أداء بيانات التدريب المختلفة مختلفًا أيضًا.
ولكن بدلاً من اختيار نموذج واحد فقط ، إذا استخدمت مجموعة من كل هذه النماذج وجمعت مخرجاتها الفردية ، فقد تتجنب اختيار النماذج الأكثر فقراً.
حجم البيانات
العديد من أساليب ونماذج تعلم الآلة ليست فعالة في نتائجها إذا قمت بتزويدهم ببيانات غير كافية أو كمية كبيرة من البيانات.
من ناحية أخرى ، يمكن أن يعمل التعلم الجماعي في كلا السيناريوهين ، حتى لو كان حجم البيانات صغيرًا جدًا أو كثير جدًا.
- إذا كانت هناك بيانات غير كافية ، فيمكنك استخدام التمهيد لتدريب المصنفات المختلفة بمساعدة عينات بيانات تمهيد مختلفة.
- إذا كان هناك حجم بيانات كبير يمكن أن يجعل تدريب مصنف واحد أمرًا صعبًا ، فيمكن عندئذٍ تقسيم البيانات استراتيجيًا إلى مجموعات فرعية أصغر.
تعقيد
قد لا يتمكن المصنف الفردي من حل بعض المشكلات المعقدة للغاية. قد تكون حدود قرارهم التي تفصل بين بيانات الفئات المختلفة معقدة للغاية. لذلك ، إذا قمت بتطبيق مصنف خطي على حدود معقدة غير خطية ، فلن يتمكن من تعلمه.
ومع ذلك ، عند الجمع بشكل صحيح بين مجموعة من المصنفات الخطية المناسبة ، يمكنك جعلها تتعلم حدودًا غير خطية معينة. سيقوم المصنف بتقسيم البيانات إلى العديد من الأقسام سهلة التعلم والأصغر ، وسيتعلم كل مصنف قسمًا واحدًا أبسط. بعد ذلك ، سيتم دمج المصنفات المختلفة لإنتاج تقريبًا. حدود القرار.
تقدير الثقة
في التعلم الجماعي ، يتم تعيين تصويت الثقة لقرار اتخذه النظام. افترض أن لديك مجموعة من المصنفات المختلفة التي تم تدريبها على مشكلة معينة. إذا وافقت غالبية المصنفين على القرار الذي تم اتخاذه ، فيمكن اعتبار نتائجه بمثابة مجموعة ذات قرار عالي الثقة.
من ناحية أخرى ، إذا كان نصف المصنفين لا يوافقون على القرار المتخذ ، فيقال إنها مجموعة ذات قرار منخفض الثقة.
ومع ذلك ، فإن الثقة المنخفضة أو العالية ليست دائمًا القرار الصحيح. ولكن هناك احتمال كبير أن يكون القرار الذي يتمتع بثقة عالية صحيحًا إذا تم تدريب المجموعة بشكل صحيح.
الدقة مع دمج البيانات
يمكن للبيانات التي يتم جمعها من مصادر متعددة ، عند دمجها بشكل استراتيجي ، تحسين دقة قرارات التصنيف. هذه الدقة أعلى من تلك التي تم إنشاؤها بمساعدة مصدر بيانات واحد.
كيف تعمل مجموعة التعلم؟
تأخذ مجموعة التعلم وظائف رسم الخرائط المتعددة التي تعلمها المصنفون المختلفون ثم يجمعهم لإنشاء وظيفة تعيين واحدة.
هذا مثال على كيفية عمل التعلم الجماعي.
مثال: أنت تقوم بإنشاء تطبيق قائم على الطعام للمستخدمين النهائيين. لتقديم تجربة مستخدم عالية الجودة ، فأنت تريد جمع ملاحظاتهم بشأن المشكلات التي يواجهونها ، والثغرات البارزة ، والأخطاء ، والأخطاء ، وما إلى ذلك.
لهذا ، يمكنك أن تطلب آراء عائلتك وأصدقائك وزملائك في العمل وغيرهم من الأشخاص الذين تتواصل معهم بشكل متكرر فيما يتعلق باختياراتهم الغذائية وتجربتهم في طلب الطعام عبر الإنترنت. يمكنك أيضًا إصدار التطبيق الخاص بك في مرحلة تجريبية لجمع التعليقات في الوقت الفعلي بدون تحيز أو تشويش.
لذا ، ما تفعله هنا في الواقع هو التفكير في العديد من الأفكار والآراء من أشخاص مختلفين للمساعدة في تحسين تجربة المستخدم.
تعمل مجموعة التعلم ونماذجها بطريقة مماثلة. يستخدم مجموعة من النماذج ويجمعها لإنتاج مخرجات نهائية لتحسين دقة التنبؤ وأدائه.
تقنيات التعلم الأساسية للمجموعة
# 1. وضع
“الوضع” هو قيمة تظهر في مجموعة بيانات. في التعلم الجماعي ، يستخدم متخصصو التعلم الآلي نماذج متعددة لإنشاء تنبؤات حول كل نقطة بيانات. تعتبر هذه التنبؤات أصواتًا فردية والتنبؤ الذي قدمته معظم النماذج يعتبر التنبؤ النهائي. يستخدم في الغالب في مشاكل التصنيف.
مثال: صنف أربعة أشخاص تطبيقك بـ 4 بينما صنفه أحدهم بـ3 ، ثم سيكون الوضع 4 لأن الأغلبية صوتت بـ 4.
# 2. متوسط متوسط
باستخدام هذه التقنية ، يأخذ المحترفون في الاعتبار جميع تنبؤات النموذج ويحسبون متوسطها للتوصل إلى التنبؤ النهائي. يتم استخدامه في الغالب في عمل تنبؤات لمشاكل الانحدار ، وحساب الاحتمالات في مشاكل التصنيف ، وأكثر من ذلك.
مثال: في المثال أعلاه ، حيث صنف أربعة أشخاص تطبيقك بـ 4 بينما صنفه شخص واحد بـ 3 ، سيكون المتوسط (4 + 4 + 4 + 4 + 3) /5=3.8
# 3. متوسط الوزن
في طريقة التعلم الجماعي هذه ، يخصص المحترفون أوزانًا مختلفة لنماذج مختلفة لعمل التنبؤ. هنا ، يصف الوزن المخصص مدى ملاءمة كل نموذج.
مثال: لنفترض أن 5 أفراد قدموا تعليقات على طلبك. من بينهم 3 مطوري تطبيقات ، بينما لا يمتلك 2 منهم أي خبرة في تطوير التطبيقات. لذا ، فإن ملاحظات هؤلاء الأشخاص الثلاثة ستعطى وزنًا أكبر من الآخرين 2.
تقنيات التعلم الجماعي المتقدمة
# 1. تكييس
التعبئة والتغليف (Bootstrap AGGregatING) هو أسلوب تعليمي بسيط للغاية للمجموعة مع أداء جيد. كما يوحي الاسم ، يتم إجراؤه من خلال الجمع بين مصطلحين “Bootstrap” و “تجميع”.
يعد Bootstrapping طريقة أخرى لأخذ العينات حيث ستحتاج إلى إنشاء مجموعات فرعية من عدة ملاحظات مأخوذة من مجموعة بيانات أصلية مع الاستبدال. هنا ، سيكون حجم المجموعة الفرعية هو نفسه حجم مجموعة البيانات الأصلية.
المصدر: Buggy programmer
لذلك ، في التعبئة ، تُستخدم المجموعات الفرعية أو الأكياس لفهم توزيع المجموعة الكاملة. ومع ذلك ، يمكن أن تكون المجموعات الفرعية أصغر من مجموعة البيانات الأصلية في التعبئة. تتضمن هذه الطريقة خوارزمية ML واحدة. الهدف من الجمع بين نتائج النماذج المختلفة هو الحصول على نتيجة معممة.
إليك كيفية عمل التعبئة:
- يتم إنشاء عدة مجموعات فرعية من المجموعة الأصلية ويتم اختيار الملاحظات مع الاستبدالات. تُستخدم المجموعات الفرعية في تدريب النماذج أو أشجار القرار.
- يتم إنشاء نموذج ضعيف أو أساسي لكل مجموعة فرعية. ستكون النماذج مستقلة عن بعضها البعض وتعمل بالتوازي.
- سيتم إجراء التنبؤ النهائي من خلال الجمع بين كل تنبؤ من كل نموذج باستخدام إحصائيات مثل المتوسط والتصويت وما إلى ذلك.
الخوارزميات الشائعة المستخدمة في تقنية المجموعة هذه هي:
- غابة عشوائية
- أشجار القرار المعبأة
تتمثل ميزة هذه الطريقة في أنها تساعد في الحفاظ على أخطاء التباين إلى الحد الأدنى في أشجار القرار.
# 2. التراص
مصدر الصورة: OpenGenus IQ
في التعميم المكدس أو المكدس ، تُستخدم التنبؤات من نماذج مختلفة ، مثل شجرة القرار ، لإنشاء نموذج جديد لعمل تنبؤات على مجموعة الاختبار هذه.
ينطوي التراص على إنشاء مجموعات فرعية من البيانات التي تم تمهيدها لنماذج التدريب ، على غرار التعبئة. ولكن هنا ، يتم أخذ ناتج النماذج كمدخل ليتم تغذيته لمصنف آخر ، يُعرف باسم المصنف التلوي للتنبؤ النهائي للعينات.
السبب في استخدام طبقتين من المصنف هو تحديد ما إذا تم تعلم مجموعات بيانات التدريب بشكل مناسب. على الرغم من أن النهج ثنائي الطبقات شائع ، يمكن أيضًا استخدام المزيد من الطبقات.
على سبيل المثال ، يمكنك استخدام 3-5 نماذج في الطبقة الأولى أو المستوى 1 ونموذج واحد في الطبقة 2 أو المستوى 2. هذا الأخير سيجمع التنبؤات التي تم الحصول عليها في المستوى 1 لعمل التنبؤ النهائي.
علاوة على ذلك ، يمكنك استخدام أي نموذج تعلم ML لتجميع التنبؤات ؛ نموذج خطي مثل الانحدار الخطي والانحدار اللوجستي وما إلى ذلك ، أمر شائع.
خوارزميات ML الشائعة المستخدمة في التكديس هي:
- مزج
- فرقة سوبر
- نماذج مكدسة
ملاحظة: يستخدم المزج التحقق من الصحة أو مجموعة الانتظار من مجموعة بيانات التدريب لعمل التنبؤات. على عكس التكديس ، يتضمن المزج تنبؤات يتم إجراؤها فقط من الرافضة.
# 3. التعزيز
التعزيز هو طريقة تعلم مجموعة تكرارية تضبط وزن ملاحظة معينة اعتمادًا على تصنيفها الأخير أو السابق. هذا يعني أن كل نموذج لاحق يهدف إلى تصحيح الأخطاء الموجودة في النموذج السابق.
إذا لم يتم تصنيف الملاحظة بشكل صحيح ، فإن التعزيز يزيد من وزن الملاحظة.
في التعزيز ، يقوم المحترفون بتدريب الخوارزمية الأولى لتعزيز مجموعة بيانات كاملة. بعد ذلك ، قاموا ببناء خوارزميات ML اللاحقة باستخدام المخلفات المستخرجة من خوارزمية التعزيز السابقة. وبالتالي ، يتم إعطاء وزن أكبر للملاحظات غير الصحيحة التي تنبأ بها النموذج السابق.
إليك كيفية عملها خطوة بخطوة:
- سيتم إنشاء مجموعة فرعية من مجموعة البيانات الأصلية. سيكون لكل نقطة بيانات نفس الأوزان في البداية.
- يتم إنشاء نموذج أساسي في المجموعة الفرعية.
- سيتم إجراء التنبؤ على مجموعة البيانات الكاملة.
- باستخدام القيم الفعلية والمتوقعة ، سيتم حساب الأخطاء.
- سيتم إعطاء المزيد من الأوزان للملاحظات التي تم التنبؤ بها بشكل غير صحيح
- سيتم إنشاء نموذج جديد وسيتم إجراء التنبؤ النهائي على مجموعة البيانات هذه ، بينما يحاول النموذج تصحيح الأخطاء التي تم إجراؤها مسبقًا. سيتم إنشاء نماذج متعددة بطريقة مماثلة ، كل منها يصحح الأخطاء السابقة
- سيتم إجراء التنبؤ النهائي من النموذج النهائي ، وهو المتوسط المرجح لجميع النماذج.
خوارزميات التعزيز الشائعة هي:
- كاتبووست
- GBM خفيف
- AdaBoost
تتمثل فائدة التعزيز في أنه يولد تنبؤات فائقة ويقلل من الأخطاء الناتجة عن التحيز.
تقنيات الفرقة الأخرى
مزيج من الخبراء: يستخدم لتدريب العديد من المصنفات ، ومخرجاتهم مجمعة مع قاعدة خطية عامة. هنا ، يتم تحديد الأوزان المعطاة للتركيبات بواسطة نموذج قابل للتدريب.
تصويت الأغلبية: يتضمن اختيار مصنف فردي ، ويتم حساب التنبؤات لكل عينة. سيكون الفصل الذي يتلقى الحد الأقصى للفئة من مجموعة المصنفات هو الفئة المتوقعة للمجموعة. يتم استخدامه لحل مشاكل مثل التصنيف الثنائي.
القاعدة القصوى: تستخدم التوزيعات الاحتمالية لكل مصنف وتوظف الثقة في عمل التنبؤات. يتم استخدامه لمشاكل التصنيف متعدد الفئات.
حالات الاستخدام الواقعية لتعلم المجموعة
# 1. كشف الوجه والعاطفة
تستخدم Ensemble Learning تقنيات مثل تحليل المكونات المستقلة (ICA) لأداء اكتشاف الوجه.
علاوة على ذلك ، يتم استخدام التعلم الجماعي في اكتشاف عاطفة الشخص من خلال اكتشاف الكلام. بالإضافة إلى ذلك ، تساعد قدراته المستخدمين على الكشف عن مشاعر الوجه.
# 2. حماية
كشف الاحتيال: يساعد التعلم الجماعي على تعزيز قوة نمذجة السلوك الطبيعي. هذا هو السبب في أنها تعتبر فعالة في الكشف عن الأنشطة الاحتيالية ، على سبيل المثال ، في بطاقات الائتمان والأنظمة المصرفية ، والاحتيال في الاتصالات السلكية واللاسلكية ، وغسيل الأموال ، وما إلى ذلك.
DDoS: رفض الخدمة الموزع (DDoS) هو هجوم مميت على مزود خدمة الإنترنت. يمكن لمصنفات المجموعات أن تقلل من اكتشاف الأخطاء وتميز أيضًا الهجمات عن حركة المرور الحقيقية.
كشف التسلل: يمكن استخدام التعلم الجماعي في أنظمة المراقبة مثل أدوات كشف التسلل للكشف عن رموز المتسللين من خلال مراقبة الشبكات أو الأنظمة ، وإيجاد الحالات الشاذة ، وما إلى ذلك.
الكشف عن البرامج الضارة: إن Ensemble Learning فعال للغاية في اكتشاف وتصنيف كود البرامج الضارة مثل فيروسات الكمبيوتر والديدان ، وبرامج الفدية ، وأحصنة طروادة ، وبرامج التجسس ، وما إلى ذلك باستخدام تقنيات التعلم الآلي.
# 3. التعلم المتزايد
في التعلم التدريجي ، تتعلم خوارزمية ML من مجموعة بيانات جديدة مع الاحتفاظ بالتعلم السابق ولكن دون الوصول إلى البيانات السابقة التي شاهدتها. تُستخدم أنظمة المجموعات في التعلم التدريجي من خلال جعلها تتعلم مصنفًا إضافيًا في كل مجموعة بيانات عندما تصبح متاحة.
# 4. الدواء
تعتبر مصنفات المجموعات مفيدة في مجال التشخيص الطبي ، مثل اكتشاف الاضطرابات العصبية الإدراكية (مثل مرض الزهايمر). يقوم بالكشف عن طريق أخذ مجموعات بيانات التصوير بالرنين المغناطيسي كمدخلات وتصنيف علم الخلايا في عنق الرحم. بصرف النظر عن ذلك ، يتم تطبيقه في البروتينات (دراسة البروتينات) وعلم الأعصاب ومجالات أخرى.
# 5. الاستشعار عن بعد
الكشف عن التغيير: تُستخدم مصنفات المجموعات لإجراء اكتشاف التغيير من خلال طرق مثل متوسط بايزي وتصويت الأغلبية.
رسم خرائط الغطاء الأرضي: تُستخدم أساليب تعلم المجموعات مثل التعزيز ، وأشجار القرار ، وتحليل المكون الرئيسي للنواة (KPCA) ، وما إلى ذلك ، لاكتشاف الغطاء الأرضي وخريطته بكفاءة.
# 6. تمويل
تعد الدقة جانبًا مهمًا من جوانب التمويل ، سواء كان الحساب أو التنبؤ. إنه يؤثر بشدة على ناتج القرارات التي تتخذها. يمكنها أيضًا تحليل التغييرات في بيانات سوق الأسهم ، واكتشاف التلاعب في أسعار الأسهم ، والمزيد.
مصادر التعلم الإضافية
# 1. طرق المجموعات للتعلم الآلي
سيساعدك هذا الكتاب على تعلم وتنفيذ طرق مهمة لتعلم المجموعات من الصفر.
# 2. طرق المجموعة: الأسس والخوارزميات
يحتوي هذا الكتاب على أساسيات التعلم الجماعي وخوارزمياته. كما توضح كيفية استخدامها في العالم الحقيقي.
# 3. فرقة التعلم
يقدم مقدمة لطريقة التجميع الموحدة ، والتحديات ، والتطبيقات ، وما إلى ذلك.
# 4. فرقة التعلم الآلي: الأساليب والتطبيقات:
يوفر تغطية واسعة لتقنيات التعلم الجماعي المتقدمة.
خاتمة
آمل أن يكون لديك الآن فكرة عن التعلم الجماعي ، وطرقه ، وحالات استخدامه ، ولماذا يمكن أن يكون استخدامه مفيدًا لحالة الاستخدام الخاصة بك. لديه القدرة على حل العديد من تحديات الحياة الواقعية ، من مجال الأمن وتطوير التطبيقات إلى التمويل والطب وغير ذلك. تتوسع استخداماته ، لذلك من المحتمل أن يكون هناك المزيد من التحسين في هذا المفهوم في المستقبل القريب.
يمكنك أيضًا استكشاف بعض الأدوات لتوليد البيانات التركيبية لتدريب نماذج التعلم الآلي