קורס Big-Data Architects
מק"ט: #9293 | משך קורס: 125 שעות אק'
| מספר מפגשים: 31

המונח ביג דאטה מתייחס בד"כ למאגרי מידע שעונים לאחת או יותר מן הדרישות הבאות:

  • המידע מורכב מנתונים בנפחים גדולים
  • מידע חדש נוצר ונכנס או יוצא מהמערכת במהירות רבה
  • כמות סוגי המידע הנאספים ומספר המקורות הם רבים ומגוונים 
הקורס פעיל לקבוצות מטעם ארגונים בלבד, ניתן לשלוח פנייה רק אם מדובר בקבוצה
*שדות חובה
PDF version

אודות

רציונל הקורס:

ארגונים השוקלים לעבור לעולם ה-Big-Data זקוקים לידע נרחב החולש על אינספור פלטפורמות, ספקי שירותים, עננים וטכנולוגיות. פערי הידע אינם מתנקזים לכדי נושא אחד אלא מתפרשים על פני כמה תחומים שכל אחד מהם הוא עולם בפני עצמו. לשם כך נדרשת פונקציה אשר תדע ותכיר את הנמצא בעולם הביג דאטה וגם תוכל לאפיין אילו רכיבים מתוך הפיתוח הקיים או העתידי שייכים לעולם זה – Big-Data Architect.

 
אלו האתגרים העיקריים הניצבים כיום בפני ארגונים השוקלים או נמצאים בתהליך של מעבר לעולם ה-Big-Data:
  • אפיון החלקים הקיימים במערכת אשר צריכים להיות מוסבות לפלטפורמת Big-Data
  • אפיון רכיבים חדשים המשתייכים לעולם זה לעומת אילו היכולים להיעזר בסביבות המסורתיות
  • איתור טכנולוגיות המתאימות לניהול התשתית ואנליזת הנתונים בארגון
 
בארגונים גדולים וקטנים כאחד מתגלה צורך בהכרה והבנה יסודית של אתגרים אלו. ארכיטקט בעל יכולת לשלב ידע רוחבי אודות פלטפורמות, טכנולוגיות, מוצרים ושירותים בעולם ה-Big-Data יוכל לתכנן וליישם ארכיטקטורת מעבר לתחום זה באופן היעיל ביותר והנכון ביותר עבור החברה.
 

אודות הקורס

קורס ביג דאטה זה מכין את בוגריו לקראת השתלבות בתעשיית ה - Big Data, ומקנה ידע נרחב בטכנולוגיות המובילות בשוק. כמו כן, קורס זה שם דגש רב על הכנה מעשית, ומשלב תרגולים רבים. במהלך השיעורים יחשפו התלמידים למאגרי מידע רבים ומגוונים ויתנסו במבני Data שונים.

קורס  Big-Data Architects מקנה בין היתר :

 

  • ידע מעמיק בארכיטקטורת Hadoopעם דגש על הפצות  Hortonworksו- Cloudera. כמחצית משיעורי ה - Hadoopיוקדשו לסביבתCloudera המחצית השנייה ל-Hortonworks
  • אבטחת מידע באמצעות כלים כגון Kerberosו-Sentry
  • ניתוח נתוני Big Dataבאמצעות Hive, Impala, Pigו-Hbase
  • תזמון משימות באמצעות Oozie
  • שינוע נתונים באמצעות Sqoop, Flumeו-Kafka
  • פיתוח אפליקציות Sparkבאמצעות Python
  • חישובים סטטיסטיים באמצעות R
  • יישומים מתקדמים לניתוח מידע באמצעות SQL
  • היכרות עם טכנולוגיות NoSQLנוספות כגון MongoDB, ו-Neo4j

 

קורס זה מלמד את כל העקרונות החשובים בטכנולוגיות ה-  Big Data  ובנוסף מקנה הבנה בטכנולוגיות שונות, המאפשרות "לראות את התמונה הגדולה".  כך, אדם העושה את צעדיו הראשונים בעולם ה Big Dataנשאר בקצב ההתקדמות של הטכנולוגיה, פותח לעצמו דלתות רבות יותר, ומבסס את עצמו בארגון בו הוא נמצא על הצד הטוב ביותר.

במהלך הקורס ינתנו מספר פרויקטים אשר יאפשרו הטמעה מעשית, ואינטגרציה בין טכנולוגיות שונות אשר נלמדו.

 

ליווי מקצועי


בקורס מרצים מיטב אנשי המקצוע בתחום.
כל המדריכים בקורס ביג דאטה הינם בעלי רקע בעבודה בשטח ובהדרכה בתחום, כולל מרצים ממיטב חברות הייעוץ בארץ.
את הקורס מנהל רם קדם, לשעבר ראש צוות Big Data בחברת Plymedia וכיום יועץ בתחום הBig Data והבינה העסקית. בעשור האחרון, במקביל לעבודתו הטכנולוגית, לימד רם אלפי אנשים בכל רחבי העולם, בנה אינספור חומרי לימוד, וכתב ספרות בתחום ה Data הנמכרת ברחבי העולם. 

קהל יעד

קהל יעד

  • קורס זה נועד בעיקרו למנהלי מסדי נתונים, אנשי BI, כותבי קוד, ראשי צוותים, מנהלי פיתוח, ואנשי מקצוע נוספים אשר עוסקים בתחום ה-Big-Data .
  • קורס זה מעניק ידע רב, ומתנהל בקצב למידה גבוה. נדרשת יכולת הבנה גבוהה, למידה עצמאית, והתמצאות טכנית.

 

תנאי קדם

  • ידע וניסיון בעבודה מול מערכות Data שונות
  • רקע בשפת ה SQL
  • ראיון אישי / ייעוץ להכוונה מקצועית  

 

זכאות לתעודת גמר

  • נוכחות ב 80% מן המפגשים לפחות
  • הגשת פרויקטים בהצלחה

משך

משך הקורס:
 
  • 125 שעות
  • לימודי ערב מ- 17:30 עד 21:45, שני מפגשים שבועיים
  • הלימודים אינם מתקיימים בחגים ומועדים. לוח חופשות עדכני יחולק לסטודנטים

נושאים

Hours

Module Description

Module Title

10

  • Make yourself comfortable with the Linux OS
  • Understand basic concepts of virtual machines
  • Create and run virtual machines in the cloud

Preparatory

5

  • Our roadmap
  • Big data basic concepts
  • Hadoop basics

Introduction to Big Data

30

  • HDFS, YARN and MapReduce (5)
    • Basic HDFS concepts
    • Working with the HDFS
    • Yarn components
    • MapReduce workflow
  • Securing the Cluster Using Kerberos and Sentry (5)
    • Hadoop’s security system concepts
    • What is kerberos and how it works
    • Securing the cluster using kerberos
    • Sentry basic concepts
  • Analyzing Data using Apache Hive and Impala (10)
    • Hive and Impala - Introduction and use-cases
    • Data types
    • Creating databases, tables, and partitions
  • Working with Apache Pig (5)
    • Pig - Introduction and use-cases
    • Pig’s data model
    • Pig Latin
  • Working with HBase (5)
    • Introduction to Hbase for processing huge tables
    • Hbase data model
    • Hbase vs. RDBMS
    • Client API (CRUD, queries and batch operations)
    • Interactive REST clients

Hadoop Eco System Basics

5

  • Introduction to Oozie
  • Workflow scheduler
  • Alerts and Notifications

Workflow and Automation

10

  • Working with Flume
  • Kafka basic concepts
  • Using Sqoop

Transporting Data

35

  • Introduction to Python(10)
  • Working with PySpark (25)
    • Basics
    • RDD Operations
    • Caching
    • Spark Streaming
    • Spark SQL and DataFrames

Spark

10

  • What is statistical programming
  • The need for Big-Data
  • R statistical language
  • introduction to R
  • installation
  • Basic usage & general statistics with R
  • Data mining using R
  • Hadoop-R

Statistical programming Using R

10

  • This module, unique of its kind in Israel, focuses on complex queries, and entirely composed of advanced “real-world” problems and solutions.
  • This training is based on a decade of experience working with various databases, challenging job interviews questions, and many complex SQL problems. In this course, students learn many different practical applications and “real-world” problems.

Advanced SQL

 

5

  • Graph database concepts
  • Basic querying - Nodes and Relationships

Working with Neo4j

5

  • Introduction to MongoDB
  • Core concepts
  • Environments
  • CRUD and the MongoDB Shell

Working with MongoDB

125

Total

 
תגיות
קורס Big Data