الفكر الإبداعى للتدريب والتطوير الإدارى

تحليل البيانات باستخدام Apache Spark

Card image cap

سعر الدورة : 4,999.99 د.إ ~~6249.9885 د.إ~~

خصم 20 %

Incl. VAT

تحليل البيانات باستخدام Apache Spark

القسم إدارة البيانات وذكاء الأعمال
التصنيف البيانات الكبيرة

تستهدف هذه الدورة المحترفين في مجال تحليل البيانات والراغبين في تعلم كيفية استخدام Apache Spark في معالجة وتحليل البيانات الكبيرة. ستتناول الدورة المفاهيم الأساسية لـ Spark، وكيفية استخدامه لأداء العمليات الحسابية الموزعة، وتحليل البيانات بكفاءة عالية، مع التركيز على تطبيقاته العملية في البيئات الحديثة.

الوصف

أهداف الدورة

فهم أساسيات Apache Spark ومكوناته الرئيسية.
تعلم كيفية معالجة وتحليل البيانات الكبيرة باستخدام Spark.
استخدام Spark SQL و DataFrames لاستكشاف البيانات وتحليلها.
تنفيذ خوارزميات تعلم الآلة على بيانات ضخمة باستخدام MLlib.
تحسين أداء استعلامات وتحليلات البيانات باستخدام تقنيات التوزيع والمعالجة المتوازية.

محاور الدورة

1. مقدمة في Apache Spark:

مفهوم البيانات الضخمة ودور Spark في معالجتها.
مكونات Apache Spark الرئيسية (Spark Core، Spark SQL، MLlib، وغيرها).
مقارنة Spark مع Hadoop MapReduce.

2. إعداد بيئة Apache Spark:

تثبيت وتشغيل Apache Spark.
العمل مع Spark على منصات مختلفة (Standalone، YARN، Kubernetes).
استخدام واجهة Spark Shell وNotebook لتنفيذ الأوامر.

3. معالجة البيانات باستخدام RDDs و DataFrames:

التعرف على RDDs (Resilient Distributed Datasets) ومزاياها.
التحول من RDDs إلى DataFrames وDataSets.
أداء العمليات الحسابية على البيانات باستخدام Spark.

4. تحليل البيانات باستخدام Spark SQL:

مقدمة في Spark SQL ودوره في تحليل البيانات.
كتابة استعلامات SQL واستكشاف البيانات داخل Spark.
تحسين استعلامات البيانات باستخدام Catalyst Optimizer.

5. تعلم الآلة باستخدام MLlib:

التعرف على مكتبة MLlib وأدواتها.
تطبيق خوارزميات تصنيف وتجميع البيانات داخل Spark.
تحليل التوقعات وتحسين أداء النماذج باستخدام Spark ML.

6. إدارة الأداء وتحسين العمليات في Spark:

تقنيات تحسين أداء تنفيذ المهام في Spark.
إدارة الذاكرة والتعامل مع التوازي في المعالجة.
تتبع الأداء وحل المشكلات باستخدام Spark UI.

7. تطبيقات عملية وتحليل البيانات في المشاريع الحقيقية:

تحليل البيانات في مجالات مختلفة (المالية، الصحة، التجارة الإلكترونية).
تنفيذ مشاريع حقيقية باستخدام Apache Spark.
التوجهات المستقبلية في تحليل البيانات باستخدام Spark.

تاريخ الإنعقاد	مكان الإنعقاد	سجل الآن
03/06/2025	دبي	سجّل الآن
29/06/2025	دبي	سجّل الآن
25/07/2025	دبي	سجّل الآن
20/08/2025	دبي	سجّل الآن
15/09/2025	دبي	سجّل الآن

التصنيف

إدارة البيانات وذكاء الأعمال

القسم

البيانات الكبيرة