تعلم R وكن عالم بيانات

تزداد شعبية لغة البرمجة R ، خاصة في علم البيانات والتحليلات.

نظرًا لأنه يوفر تقنيات تصور بيانات أفضل ، البرمجة R يلعب دورًا مهمًا في الإحصاء.

ومع ذلك ، قد يكون تعلم هذه اللغة محبطًا إذا لم يكن لديك مسار واضح للتعامل معها. في الماضي ، ربما عانيت كثيرًا أثناء تعلم لغة R أو أي لغة أخرى.

صدقني؛ لست وحدك!

لا تلوم نفسك كليًا أو اللغة ؛ قد تكون المشكلة في نهجك. الطريقة التي تتعلم بها شيئًا ما لها دور كبير في تقديم النتيجة النهائية.

إذا كانت لديك إستراتيجية واضحة لكيفية ولماذا يجب أن تتعلم لغة معينة ، فإن فرصة إتقانها تزيد. وبالمثل ، إذا لم يتماشى هدفك واستراتيجيتك ، فقد تشعر بالملل من اللغة وينتهي بك الأمر إلى تركها في منتصف الطريق.

إنه مشابه لتعلم لغة منطوقة.

لذلك ، عندما تكون مستعدًا لتعلم R ، أوضح دافعك في المقام الأول ، سواء كان ذلك توسيع نطاق معرفتك أو العثور على وظيفة في علم البيانات. بعد ذلك ، قم بإعداد إستراتيجية ومواءمتها مع هدفك.

… وابدأ التعلم.

في هذه المقالة ، سأتحدث عن بعض الموارد الجيدة لتعلم لغة البرمجة R التي ستمنحك النهج الصحيح لتسهيل الأمور.

لكن أول الأشياء أولاً ،

ما هي لغة البرمجة R؟

R هي لغة برمجة مفتوحة المصدر للرسومات والحوسبة الإحصائية.

تم تطويره في عام 1993 بواسطة Ross Ihaka & Robert Gentleman. إنها تشبه لغة البرمجة – S. يمكنك القول أن لغة البرمجة R هي تطبيق لـ S ، وتجمع بين دلالات تحديد النطاق المعجمي. البرنامج مكتوب بشكل رئيسي باللغات C و R و Fortran.

تقدم R مجموعة متنوعة من التقنيات الإحصائية والرسومية بالإضافة إلى كونها قابلة للتوسيع بدرجة كبيرة. ويشمل الاختبار الإحصائي الكلاسيكي ، والنمذجة الخطية وغير الخطية ، وتحليل السلاسل الزمنية ، والتكتل ، والتصنيف.

تتمثل إحدى نقاط القوة الرئيسية للغة R في كونها سهلة في إنتاج مؤامرة جيدة التصميم وجودة النشر ، بما في ذلك الصيغ والرموز الرياضية.

قدرات R

R هو نوع من مجموعة متكاملة تتكون من مرافق برمجية يمكنك استخدامها للحساب والتمثيل الرسومي ومعالجة البيانات.

ويشمل:

  • مرفق التخزين الفعال ومعالجة البيانات
  • مجموعة متكاملة ومتماسكة وكبيرة من أدوات تحليل البيانات
  • مجموعة من عوامل مختلفة مفيدة في حساب المصفوفات في مصفوفات محددة
  • لغة برمجة بسيطة وفعالة ومتطورة بشكل جيد مع الحلقات والشرطية والمتغيرات المحددة من قبل المستخدم
  • تسهيلات رسومية لتحليل البيانات وعرضها على نسخة مطبوعة أو على الشاشة
  • R قادر على التمديد من خلال الحزم. في الواقع ، يتم توفير حوالي 8 عبوات باستخدام توزيع R ، بينما يمكن إضافة المزيد مع عائلة موقع CRAN.
  • إمكانية التشغيل البيني عبر الأنظمة الأساسية
  • بدلاً من استخدام مترجم ، يستخدم R مترجمًا ، مما يساعد في تسهيل تطوير الكود.
  • يرتبط جيدًا بقواعد البيانات المختلفة ويقدم معلومات من MS Access و Excel و MySQL و Oracle و SQLite وما إلى ذلك.
  • إنه يدمج أدوات قوية لتوصيل التقارير بأشكال مختلفة مثل HTML و XML و CSV و PDF والمواقع التفاعلية مع حزم R.
  • تأتي حزم R مع أكواد وميزات ووظائف متنوعة مصممة للنمذجة الإحصائية وتحليل البيانات والتعلم الآلي والتصور واستيراد البيانات والمعالجة.

كيف تساعد R في تحليل البيانات؟

يتم تحليل البيانات باستخدام R في سلسلة من الخطوات المختلفة:

  • البرنامج أو الاستيراد: البرمجة باستخدام R أو يمكنك استيراد البيانات من قواعد البيانات والملفات إلى بيئة برنامج R.
  • التحويل: يحدث تنظيم البيانات عن طريق تحويل عمود إلى متغير أثناء الصف إلى ملاحظة. راقب اهتماماتك ، وأنشئ متغيرًا جديدًا كدالة للمتغيرات الحالية ، واكتشف إحصائيات المراقبة.
  • التصور: تمثيلات البيانات في شكل رسومي للتعرف على الاتجاهات والأنماط واستثناءات البيانات بسهولة.
  • النماذج: أدوات تصور تكميلية مثل الأدوات الحسابية أو الرياضية للإجابة على أسئلة المراقبة.
  • التواصل: توصيل النتائج مع الآخرين ، من التصور إلى النمذجة مباشرةً ، بمساعدة المخططات سهلة الإنتاج وجودة الطباعة لمشاركتها مع أي شخص في العالم.
  كيفية حساب الخلاف غير القابل للإلغاء

من يستخدم R ولماذا؟

R موثوقة ليس فقط في الأكاديميين ولكن أيضًا من قبل الشركات الكبيرة ، بما في ذلك Google و Facebook و Airbnb و Uber والمزيد. يتم استخدامه في الرعاية الصحية ، والاستشارات ، والحكومة ، والتأمين ، والطاقة ، والتمويل ، والإعلام ، في كل مكان تقريبًا. يستخدمونها للاستدلال الإحصائي وخوارزميات التعلم الآلي وتحليل البيانات.

كما ترى ، فإن الطلب على R موجود في قطاعات مختلفة. بالإضافة إلى ذلك ، فإن تحليل البيانات يشكل بلا شك الأعمال التجارية الحالية. على الرغم من وجود الكثير من الأدوات المتاحة ، فإن R تبرز. هذا لأنه قد يكون لديك:

  • Excel و PowerBI ، لكنهما يفتقران إلى القدرة على النمذجة ؛
  • تعد Python رائعة بالنسبة إلى AI و ML ولكنها لا تحتوي على ميزات اتصال ؛
  • SAS مفيد للتحليل الإحصائي ولكنه ليس مجانيًا
  • يعد Tableau ممتازًا للتمثيلات الرسومية ، لكنه يحتاج إلى أداء أفضل في صنع القرار والإحصاءات.

ومع ذلك ، تملأ R الفجوة من خلال تقديم منحنى تعليمي ممتاز مع توازن جيد في تنفيذ البيانات وتحليلها.

ومن ثم ، فمن المنطقي أن تتعلم R من أجل معالجة البيانات وتحليلها وحتى أن تصبح عالم بيانات.

وهذا هو السبب في أن علماء البيانات يستخدمون R لفهم البيانات وإجراء التلاعب واتخاذ أفضل نهج والتواصل مع الآخرين من خلال التقارير أو لوحات المعلومات أو تطبيقات الويب. بهذه الطريقة ، تقوم منصة واحدة بتنفيذ كل الأعمال.

أنت الآن تعرف كيف يعمل R ولماذا يجب أن تذهب إليه ، ولكن أين تتعلم R؟

هل هذا صعب التعلم؟

إذا سألتني هذه الأسئلة قبل بضع سنوات ، كنت سأقول نعم ، إنها صعبة بعض الشيء بسبب هيكلها المعقد. ولكن الآن ، يتم تقديم الحزم للتغلب على هذه المشكلة ، مما جعل معالجة البيانات أسهل وبديهيًا ، كما أن إنشاء الرسم البياني أصبح أمرًا سهلاً إلى حد ما.

تتيح لك الحزم مثل TensorFlow و Keras إنشاء تقنيات ML المتطورة ؛ يمكنك استدعاء Python و C ++ و Java في R والتواصل مع Hadoop أو Spark. وقد تطورت R أيضًا من حيث السرعة الحسابية.

لذا ، هل تريد أن تتعلم R؟

أفترض نعم!

دعونا نجد بعض الموارد الجيدة لتعلم R.

عالم البيانات مع R.

اكتسب مهارات R التي يمكن أن تساعدك في بناء حياتك المهنية كعالم بيانات داتاكامب. لبدء الدورة ، لا تحتاج إلى أي معرفة أو خبرة سابقة في هذا المجال.

سوف يعلمونك لغة R متعددة الاستخدامات وكيف يمكنك استخدامها لاستيراد البيانات ومعالجتها وتصورها وتنظيفها ، وهي المهارات الأساسية الأساسية التي تحتاجها. من خلال التمارين التفاعلية ، احصل على خبرة عملية مع حزم R الشهيرة مثل ggplot2 جنبًا إلى جنب مع حزم Tidyverse مثل readr و dplyr.

ستقدم لك الدورة أيضًا بعض مجموعات البيانات الواقعية التي تساعدك على تعلم التعلم الآلي والتقنيات الإحصائية اللازمة لكتابة الوظائف وإجراء تحليل الكتلة بنفسك.

كل ما عليك فعله هو بدء هذه الدورة ، وتنمية مهارات R ، ومواصلة مسارك لتصبح عالم بيانات ناجحًا. أنها توفر أكثر من 75 ساعة من موارد التعلم. يتضمن إدخال اللغة لإتقان أساسيات تحليلات البيانات باستخدام هياكل البيانات النموذجية مثل المصفوفات والمتجهات وإطارات البيانات وما إلى ذلك.

R برمجة AZ

Udemy يجلب R Programming AZ مع تمارين عملية لمساعدتك على أن تصبح عالم بيانات. تنقسم الدورة إلى 8 أقسام ، 82 محاضرة ، وتستغرق حوالي 11 ساعة لإكمالها.

إنهم يعلمونك R خطوة بخطوة ، وسوف تتعلم مفاهيم قيمة قابلة للتطبيق على الفور بعد كل محاضرة. والشيء الرائع الآخر هو أنهم يعلمونك المفاهيم بمساعدة الأمثلة الحية. التدريب بأكمله مليء بالتحديات التحليلية الواقعية التي ستحلها أثناء محاضرتك وتمرين واجبك المنزلي.

يمكن لأي شخص لديه أي مجموعة مهارات تعلم هذه الدورة ، ولكن عليك أن تتعلم لغة R وتواجه تحديات مثيرة. تعلمك مادة الدورة التدريبية مبادئها الأساسية وكيفية إنشاء المتغيرات والمتجهات والحلقات والوظائف.

  كيفية تسجيل الدخول إلى حسابات الخلاف المتعددة

سوف تتعلم أيضًا عن التوزيع الطبيعي وممارسة البيانات المالية والبيانات الإحصائية والبيانات الرياضية. بالإضافة إلى ذلك ، ستتعلم كيفية استخدام R Studio وتخصيصه بناءً على تفضيلاتك.

في نهاية هذه الدورة ، ستقوم بتثبيت حزم R وفهم الأعداد الكبيرة ، والأعداد الصحيحة ، والمزدوجة ، والحرف ، والمزيد. تتضمن الدورة أيضًا التصور المتقدم باستخدام GGPlot2 جنبًا إلى جنب مع حلول الواجبات المنزلية والبرامج التعليمية الإضافية.

الإحصاء مع R

كورسيرا تقدم هذه الدورة – الإحصائيات مع تخصص R لمساعدتك على إتقان R لتحليل البيانات ، بما في ذلك النمذجة والاستدلال وتقنيات Bayesian. هذه الدورة مجانية تمامًا وتقدمها جامعة ديوك.

ستكتسب هذه الدورة مهارات مثل الاستدلال الإحصائي ، والانحدار الخطي والإحصاء ، و RStudio ، وبرمجة R ، وتحليل البيانات الاستكشافية ، واختبار الفرضيات الإحصائية ، وإحصاءات Bayesian ، والانحدار الخطي Bayesian ، والاستدلال Bayesian ، وتحليل الانحدار ، واختيار النموذج.

سيعلمك التخصص كيفية تصور وتحليل البيانات بلغة البرمجة R ثم إنشاء تقارير قابلة للتكرار. سوف تتعلم كيفية عرض الاستدلال الإحصائي بطبيعته الموحدة وأداء النمذجة والتقنيات الأخرى لاتخاذ قرارات تعتمد على البيانات.

ستساعدك الدورة أيضًا على توصيل النتائج بشكل صحيح ، وتنظيم البيانات وتصورها باستخدام حزم R ، وانتقاد القرارات والمطالبات. سوف يساعدك على بناء محفظتك بمشاريع مختلفة في تحليل البيانات لإظهار معرفتك ومهاراتك بالإضافة إلى الحصول على وظيفة ذات رواتب عالية.

تستغرق هذه الدورة التدريبية على مستوى المبتدئين حوالي 7 أشهر لإكمالها ، وتتميز بجدول زمني مرن ومحاضرات كاملة عبر الإنترنت وشهادة قابلة للمشاركة عند الانتهاء.

الشروع في العمل مع R

دورة أخرى من كورسيرا في هذه القائمة هي – الشروع في العمل مع R.

هذه دورة على مستوى المبتدئين تستغرق حوالي ساعتين حتى تكتمل ، ولا يمكنك الوصول إليها إلا على سطح المكتب دون الحاجة إلى تنزيل. يعلمك هذا المشروع الإرشادي أساسيات برمجة R لاتخاذ خطوتك الأولى نحو تحليل البيانات.

هنا ، ستتعلم كيفية استخدام R Studio أو R GUI وهياكل وأنواع البيانات المختلفة المستخدمة في هذه اللغة. أخيرًا ، سيعلمونك كيفية تثبيت حزم R واستيراد مجموعات البيانات الخاصة بك إلى مساحة عمل R Studio.

لا توجد متطلبات مسبقة ضرورية لإكمال هذا المشروع ؛ فقط المعرفة الأساسية بالكمبيوتر كافية. في المشروع الموجه ، ستكون مساحة عملك عبارة عن سطح مكتب سحابي يمكنك الوصول إليه من متصفحك. سيرشدك مدرسك في شاشة مقسمة عبر مقطع فيديو ليجعلك تفهم الأشياء خطوة بخطوة.

يوداسيتي

تعلم برمجة R لتكون عالم بيانات مع يوداسيتي. الوقت التقريبي الذي تستغرقه هذه الدورة هو 3 أشهر مع 10 ساعات من الجهد كل أسبوع ، ولا تحتاج إلى شروط مسبقة صعبة.

يتضمن المنهج الدراسي تعليمك كيفية البرمجة في R وسطر الأوامر و SQL و Git حتى تتمكن من حل المشكلات المتعلقة بالبيانات. سوف تتعلم أساسيات SQL مثل JOINs والاستعلامات الفرعية والتجميعات واستخدامها للإجابة على مشاكل العمل.

تعلم الأساسيات ، بما في ذلك هياكل البيانات والحلقات والوظائف والمتغيرات. بالإضافة إلى ذلك ، ستتعلم كيفية تصور البيانات من خلال GGPlot2.

يشتمل البرنامج على مشاريع واقعية ذات محتوى غامر تم تطويره بواسطة الخبراء ودعم الموجهين والخدمات المهنية مثل مراجعات السيرة الذاتية والمحفظة. ادرس وفقًا لجدولك الخاص ، واحصل على ملاحظات شخصية ونصائح عملية واقتراحات إضافية لمزيد من الموارد.

عالم ML مع R.

إتقان لغة R لتصبح عالمًا واثقًا في التعلم الآلي داتاكامب. يقدمون 15 دورة في المجموع مع 60 ساعة من الجهد في التعلم R. Here؛ ستعمل على تحسين مهاراتك في R باستخدام صندوق أدوات وتؤدي التعلم غير الخاضع للإشراف والإشراف.

سوف يعلمونك كيفية معالجة البيانات لإنشاء النماذج وتدريب النماذج وتصورها واختبار أدائها. بالإضافة إلى ذلك ، سوف تساعد في ضبط المعلمات الخاصة بهم لتنفيذ أداء أفضل.

وفي الوقت نفسه ، ستتعلم أيضًا إحصائيات Bayesian و Spark ومعالجة اللغة الطبيعية (NLP). سوف يعلمونك أساسيات التعلم الآلي للتصنيف ، وكيف يمكنك توقع الأحداث المستقبلية من خلال الانحدار الخطي ، والعشوائية ، والغابات ، و xgboost ، والنماذج المضافة.

  كيفية وضع علامة على رسائل البريد الإلكتروني كمقروءة في Gmail

سوف تتعلم أيضًا الأبعاد ، والتجميع ، و ML في Tidyverse ، والانحدار اللوجستي ، وتحليل الكتلة ، و ML مع علامة الإقحام ، والنماذج القائمة على الأشجار ، وآلات ناقلات الدعم ، ونمذجة الموضوع ، وضبط المعلمات المفرطة ، والمزيد.

تحليلات البيانات مع R.

تقدم Edureka البرنامج التدريبي- تحليلات البيانات مع R. لمساعدتك في اكتساب الخبرة في معالجة البيانات ، والتصور ، وتحليل البيانات الاستكشافية ، والتعدين ، وتحليل المشاعر ، والانحدار.

يمكن أن يساعدك التدريب أيضًا في تعلم R Studio لدراسات الحالة عبر وسائل التواصل الاجتماعي والبيع بالتجزئة. لقد صمموا هذه الدورة لتقديم المهارات والمعرفة اللازمة ليصبحوا متخصصين في تحليل البيانات. يغطي مفاهيم R الأساسية إلى الموضوعات المتقدمة مثل مجموعة شجرة القرار والتصفية التعاونية والمزيد.

توجهك الوحدات النمطية من خلال المصطلحات المهمة مثل ذكاء الأعمال والبيانات والمعلومات وتحليلات الأعمال والمزيد. سوف تتعلم طرق استيراد البيانات ، وتحليل البيانات الاستكشافية ، والتجميع ، والانحدار الخطي واللوجستي ، وتقنيات ML الخاضعة للإشراف ، وحزم ANOVA ، و R ، وإنشاء المؤامرات ، والمزيد ، إلى جانب عمل المشروع.

لمتابعة هذه الدورة ، تحتاج إلى معرفة أساسية بالإحصاءات. يتضمن 30 ساعة من الفصول الدراسية عبر الإنترنت حيث ستحصل على مهام عملية لإكمالها بعد كل فصل ، إلى جانب إمكانية الوصول مدى الحياة إلى الدورة التدريبية من خلال العروض التقديمية وتسجيلات الفصل وأدلة التثبيت والاختبارات. احصل على شهادة عند الانتهاء من الدورة.

موقع يوتيوب

تعلم R على موقع يوتيوب مع Barton Poulson ، الذي يعلم أساسيات لغة R والحساب الإحصائي.

يغطي البرنامج التعليمي موضوعات مثل كيفية تثبيت R ، وأشياء حول R Studio ، ووظيفة الرسم ، والحزم ، والرسوم البيانية ، والمخططات الشريطية ، والمخططات المبعثرة ، والوظيفة الموجزة ، وتراكب المؤامرات ، ووصف الوظيفة.

كما يقوم بتدريس كيفية تحديد الحالات والعوامل وتنسيق البيانات وكيفية إدخال البيانات واستيراد البيانات ومفاهيم التجميع الهرمي والانحدار والمكونات الرئيسية والمزيد.

Codecademy

Codecademy يقدم لك المفاهيم الأساسية للغة البرمجة R. لا توجد متطلبات مسبقة محددة لتعلم هذه الدورة التدريبية أو أي معرفة بالترميز مطلوبة.

هنا ، ستتعلم كيفية تنظيم البيانات وتعديلها وتنظيف إطارات البيانات. سوف يعلمونك أيضًا إنشاء تصورات للبيانات وعرض الأفكار. بالإضافة إلى ذلك ، ستتعلم اختبار الفرضيات والإحصاءات للتميز في مجال تحليل البيانات.

يتضمن منهج الدورة أيضًا أساسيات المجاميع وربط الجداول باستخدام dplyr ؛ وضع الحساب والمتوسط ​​والوسيط ؛ والإحصاءات مثل الربعية والمدى الربيعي والكميات.

يمكنك أيضًا اختبار معلوماتك من خلال الاختبارات القصيرة لشحذ بناء الجملة والذاكرة. يستغرق إكمال الدورة حوالي 20 ساعة ، وباستخدام خطة Pro ، يمكنك الحصول على شهادة.

داتامينتور

داتامينتور تتضمن الدورة التدريبية وصولاً غير محدود إلى أكثر من 45 مقطع فيديو ومهام تفاعلية وكتاب إلكتروني من R Essentials ومشروع.

يطلعك على أساسيات علم البيانات وعملياته والخطوات المختلفة التي يجب عليك اتخاذها لإكمال مهمة علم البيانات مثل الحصول على البيانات والاستكشاف والنمذجة وإبلاغ التقرير.

استنتاج

مع توفر الكثير من الموارد ، لم يعد تعلم لغة البرمجة R مهمة صعبة. كل ما تحتاجه هو أن يكون لديك شغف للتعلم ورغبة قوية في المغامرة في مجال علم البيانات.

إذن ، هل أنت محترف طموح في علوم البيانات؟ 💡

تعلم R بمساعدة الدورات المذهلة المذكورة أعلاه.