קורס Big-Data Architects
מק"ט: #9293 | משך קורס: 125 שעות אק'
| מספר מפגשים: 31

המונח Big-Data מתייחס בד"כ למאגרי מידע שעונים לאחת או יותר מן הדרישות הבאות:

  • כוללים נתונים בנפחים גדולים אשר בסיסי נתונים קונבנציונליים אינם מהווים פתרון אידיאלי לאחסון ושליפה מהירה של מידע זה
  • מידע חדש נוצר ונכנס או יוצא מהמערכת במהירות רבה והיכולת להתמודד עם שטף המידע הינה אתגר קשה מאוד לפיצוח
  • כמות סוגי המידע הנאספים ומספר המקורות הם רבים ומגוונים. בעיקר אם מעורבים מקורות מידע שאינם מובנים (שורות ועמודות)
לפרטים נוספים, מלא את פרטיך או התקשר 03-7100779
*שדות חובה
PDF version

מטרות

רציונל הקורס:

ארגונים השוקלים לעבור לעולם ה-Big-Data זקוקים לידע נרחב החולש על אינספור פלטפורמות, ספקי שירותים, עננים וטכנולוגיות. פערי הידע אינם מתנקזים לכדי נושא אחד אלא מתפרשים על פני כמה תחומים שכל אחד מהם הוא עולם בפני עצמו. לשם כך נדרשת פונקציה אשר תדע ותכיר את הנמצא בעולם הביג דאטה וגם תוכל לאפיין אילו רכיבים מתוך הפיתוח הקיים או העתידי שייכים לעולם זה – Big-Data Architect.
 
אלו האתגרים העיקריים הניצבים כיום בפני ארגונים השוקלים או נמצאים בתהליך של מעבר לעולם ה-Big-Data:
  • אפיון החלקים הקיימים במערכת אשר צריכים להיות מוסבים לפלטפורמות Big-Data
  • אפיון רכיבים חדשים המשתייכים לעולם זה לעומת אילו היכולים להיעזר בסביבות המסורתיות
  • איתור טכנולוגיות מתאימות לניהול התשתית בארגון
  • אחסון, ניתוח ועיבוד מידע לא-מובנה ורב (non-structured data)
 
בארגונים גדולים וקטנים כאחד מתגלה צורך בהכרה והבנה יסודית של אתגרים אלו. ארכיטקט בעל יכולת לשלב ידע רוחבי אודות פלטפורמות, טכנולוגיות, מוצרים ושירותים בעולם ה-Big-Data יוכל לתכנן וליישם ארכיטקטורת מעבר לתחום זה באופן היעיל ביותר והנכון ביותר עבור החברה.
 

אודות הקורס

קורס זה מכין את בוגריו לקראת השתלבות בתעשיית ה - Big Data, ומקנה ידע נרחב בטכנולוגיות המובילות בשוק. כמו כן, קורס זה שם דגש רב על הכנה מעשית, ומשלב תרגולים רבים. במהלך השיעורים יחשפו התלמידים למאגרי מידע רבים ומגוונים ויתנסו במבני Data שונים.
הקורס מקנה בין היתר:

  • ידע מעמיק בטכנולוגיית Hadoop (בדגש על הפצות Hortonworks ו- Cloudera)
  • הבנה נרחבת בניתוח Data באמצעות כלים כגון Hive, Pig ו-Spark
  • כלים פרקטיים לשינוע נתונים באמצעות Sqoop ,Flume ו-Kafka
  • היכרות עם טכנולוגיות NoSQL נוספות כגון MongoDB, HBase ו-Neo4j
  • בנוסף, במהלך הקורס מועבר מודול המתמקד בכתיבת שאילתות מורכבות, וכן נרכש ידע בטכנולוגיות Big Data נוספות

במהלך הקורס נלמדים כל העקרונות החשובים בטכנולוגיות ה - Big Data. בנוסף לכך הקורס מקנה הבנה בטכנולוגיות שונות, המאפשרות "לראות את התמונה הגדולה". כך, אדם העושה את צעדיו הראשונים בעולם ה - Big Data נשאר בקצב ההתקדמות של הטכנולוגיה, פותח לעצמו דלתות רבות יותר, ומבסס את עצמו בארגון בו הוא נמצא על הצד הטוב ביותר. 

 

ליווי מקצועי
בקורס מרצים מיטב אנשי המקצוע בתחום.
כל המדריכים בקורס הינם בעלי רקע בעבודה בשטח ובהדרכה בתחום, כולל מרצים ממיטב חברות הייעוץ בארץ.
את הקורס מנהל רם קדם, לשעבר ראש צוות Big Data בחברת Plymedia וכיום יועץ בתחום הBig Data והבינה העסקית. בעשור האחרון, במקביל לעבודתו הטכנולוגית, לימד רם אלפי אנשים בכל רחבי העולם, בנה אינספור חומרי לימוד, וכתב ספרות בתחום ה Data הנמכרת ברחבי העולם. 

קהל יעד

קהל יעד

  • קורס זה נועד בעיקרו למנהלי מסדי נתונים, אנשי BI, כותבי קוד, ראשי צוותים, מנהלי פיתוח, ואנשי מקצוע נוספים אשר עוסקים בתחום ה-Big-Data .
  • קורס זה מעניק ידע רב, ומתנהל בקצב למידה גבוה. נדרשת יכולת הבנה גבוהה, למידה עצמאית, והתמצאות טכנית.

 

זכאות לתעודת גמר

  • נוכחות ב 80% מן המפגשים לפחות
  • הגשת פרויקטים בהצלחה

משך

משך הקורס:
 
  • 125 שעות
  • לימודי ערב מ- 17:30 עד 21:45, שני מפגשים שבועיים
  • הלימודים אינם מתקיימים בחגים ומועדים. לוח חופשות עדכני יחולק לסטודנטים

נושאים

Hours

Module Description

Module Title

10

  • Make yourself comfortable with the Linux OS
  • Understand basic concepts of virtual machines
  • Create and run virtual machines in the cloud

Preparatory

5

  • Our roadmap
  • Big data basic concepts
  • Hadoop basics

Introduction to Big Data

30

  • HDFS, YARN and MapReduce (5)
    • Basic HDFS concepts
    • Working with the HDFS
    • Yarn components
    • MapReduce workflow
  • Securing the Cluster Using Kerberos and Sentry (5)
    • Hadoop’s security system concepts
    • What is kerberos and how it works
    • Securing the cluster using kerberos
    • Sentry basic concepts
  • Analyzing Data using Apache Hive and Impala (10)
    • Hive and Impala - Introduction and use-cases
    • Data types
    • Creating databases, tables, and partitions
  • Working with Apache Pig (5)
    • Pig - Introduction and use-cases
    • Pig’s data model
    • Pig Latin
  • Working with HBase (5)
    • Introduction to Hbase for processing huge tables
    • Hbase data model
    • Hbase vs. RDBMS
    • Client API (CRUD, queries and batch operations)
    • Interactive REST clients

Hadoop Eco System Basics

5

  • Introduction to Oozie
  • Workflow scheduler
  • Alerts and Notifications

Workflow and Automation

10

  • Working with Flume
  • Kafka basic concepts
  • Using Sqoop

Transporting Data

35

  • Introduction to Scala (10)
  • Working with Spark (25)
    • Basics
    • RDD Operations
    • Caching
    • Spark Streaming
    • Spark SQL and DataFrames

Spark

10

  • What is statistical programming
  • The need for Big-Data
  • R statistical language
  • introduction to R
  • installation
  • Basic usage & general statistics with R
  • Data mining using R
  • Hadoop-R

Statistical programming Using R

10

  • This module, unique of its kind in Israel, focuses on complex queries, and entirely composed of advanced “real-world” problems and solutions.
  • This training is based on a decade of experience working with various databases, challenging job interviews questions, and many complex SQL problems. In this course, students learn many different practical applications and “real-world” problems.

Advanced SQL

 

5

  • Graph database concepts
  • Basic querying - Nodes and Relationships

Working with Neo4j

5

  • Introduction to MongoDB
  • Core concepts
  • Environments
  • CRUD and the MongoDB Shell

Working with MongoDB

125

Total

 
תגיות
קורס Big Data   |   קורס DBA