קורסים מקצועיים למתקדמים

דאטה ומסדי נתונים - Data

Spark Programming with Python

מספר הקורס 3577

למה ללמוד בג'ון ברייס?
  • למידה חדשנית ודינמית עם כלים מתקדמים בשילוב סימולציות, תרגול וסביבות מעבדה
  • מגוון הכשרות טכנולוגיות עם תכנים המותאמים להתפתחות הטכנולוגית ולביקוש בתעשיית ההייטק
  • מובילים את תחום ההכשרות לעולם ההייטק והטכנולוגיה כבר 30 שנה, עם קהילה של עשרות אלפי בוגרים
  • אתם בוחרים איך ללמוד: פרונטאלית בכיתה, מרחוק ב- Live Class או בלמידה עצמית

המועדים הקרובים

קורס לקבוצות

הקורס נפתח במתכונת של קבוצה בלבד, בהתאמה אישית לארגונים.
לפרטים נוספים: Muzman@johnbryce.co.il

משך הקורס

שעות לימוד:

24

מספר מפגשים:

קורס בוקר:

3

מתכונת הקורס

הקורסים המוזמנים לארגונים מותאמים באופן אישי ומלא לצרכי הארגון, מערכי הלימוד גמישים וניתן לשלב בהם תכנים רלוונטיים וייעודיים.

Overview

Apache Spark™ is a fast and general engine for large-scale data processing, and arguably the first open source software that makes distributed programming truly accessible to data scientists.

Using Apache Spark™ you can write applications quickly using Java, Scala, Python, and R.

Python is a dynamic object-oriented programming language. Due to its powerful and flexible syntax, Python is an excellent platform for scientific computing. Versatility, simplicity of use, high portability and the large number of open source modules and packages make it very popular for scientific use.

This course covers all the fundamentals about Apache Spark with Python and guides you through everything you need to know about developing Spark applications with Python.

At the end of this course, you will gain deep understanding about the Spark architecture and general big data analysis and manipulations skills.

מטרות הקורס

Who Should Attend

Developers who would like to start using Spark

תכנית הלימודים

full syllabus
PDF להורדה

 

Python Crash Course 

  • Basic Syntax
  • Tuples, Lists, and Dictionaries
  • Lambda functions

 

Spark Core

  • What is Spark?
  • RDD Basics.
  • Transformations and Actions.
  • Chaining Transformations
  • Using Anonymous Functions
  • Map Reduce and Shuffles.
  • Caching.
  • Web Monitoring.
  • Usecases.
  • Serialization.
  • Troubleshooting

Spark Streaming

  • Introduction to Spark Streaming.
  • DStream.
  • Usecases.

                                   

Spark SQL

  • Introduction to Spark SQL & DataFrames.
  • Integration with Different Data Sources.
  • Integration with Hive.

                                   

Spark MLlib

  • Introduction to Machine Learning.
  • The MLlib API.
  • Basic Usecases.

 

 

prerequisites
  • Previous programming experience

Schedule Appointment

Fill out the form below, and we will be in touch shortly.

לא הצלחנו לאתר את הטופס.