data science bootcamp · statistical hypothesis testing (t-test, z-test) •confidence intervals....

4
הוא מסלול ייחודי המכשיר אקדמאים מצטיינים כמדעני נתונים.Data Science Bootcamp תפקידו של מדען הנתונים הינו ביצוע מחקרי מידע מעמיקים, קביעת שיטות עבודה מומלצות לאיסוף נתונים, והפעלה של אלגוריתמים שונים של מידול ולמידת מכונה על הנתונים על מנת להפיק תובנות עסקיות לארגון.תחומי, להבין בתוכנות, שפות פיתוח שונות ובתחומים- מדען הנתונים צריך להחזיק בסל כישורים רב מתקדמים כמו למידת מכונה, סטטיסטיקה וכריית נתונים. מסלול זה מספק ידע רב ומעמיק בכל, בנייתPython, Machine Learning, Data Mining, SQL, Big Data , התחומים הנדרשים אלגוריתמים ומודלים לעבודה עם הנתונים, שימוש בטכנולוגיות חדשות בתחום, ניתוח נתונים מבוזר, שימוש בשירותי ענן ועוד. רב, והידע הנרכש ישמש ליישום פתרונות עבור סוגים שונים שלHands-On המסלול כולל תרגול בעיות עסקיות מהתעשייה. מובילה בהסבה והכשרה למקצועות ההייטק. התוכנית מאתרתExperis Academy תוכנית אקדמאים בעלי פוטנציאל ומספקת להם הכשרה מעמיקה ואינטנסיבית הכוללת למידה, במשך מספר חודשים.Bootcamp יומיומית במודל,Java & C#, BI בתחומי פיתוח לתפקידי המכשירים מסלולים מספר בתוכנית. בסיום המסלול נקלטיםData Science- וC/C++ & Python, Full Stack, Data Analysis בוגרי התוכנית לתפקיד ראשון אצל לקוחותינו. במשך עשור של עשייה, הכשרנו מעל אלף אנשי הייטק שהשתלבו בהצלחה בתעשייה. התוכנית נבחרה על ידי רשות החדשנות למיזם סיירות התכנות.Data Science Bootcamp

Upload: others

Post on 30-Jan-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Data Science Bootcamp · Statistical hypothesis testing (t-test, z-test) •Confidence intervals. Syllabus Outline / 700 hours. ... • Introduction and demo of scikit-learn MODULE

Data Science Bootcamp הוא מסלול ייחודי המכשיר אקדמאים מצטיינים כמדעני נתונים.

תפקידו של מדען הנתונים הינו ביצוע מחקרי מידע מעמיקים, קביעת שיטות עבודה מומלצות לאיסוף נתונים, והפעלה של אלגוריתמים שונים של מידול ולמידת מכונה על הנתונים על מנת להפיק תובנות

עסקיות לארגון.

מדען הנתונים צריך להחזיק בסל כישורים רב-תחומי, להבין בתוכנות, שפות פיתוח שונות ובתחומים בכל ומעמיק רב ידע מספק זה מסלול נתונים. וכריית סטטיסטיקה מכונה, למידת כמו מתקדמים בניית ,Python, Machine Learning, Data Mining, SQL, Big Data הנדרשים, התחומים אלגוריתמים ומודלים לעבודה עם הנתונים, שימוש בטכנולוגיות חדשות בתחום, ניתוח נתונים מבוזר,

שימוש בשירותי ענן ועוד.

המסלול כולל תרגול Hands-On רב, והידע הנרכש ישמש ליישום פתרונות עבור סוגים שונים של בעיות עסקיות מהתעשייה.

תוכנית Experis Academy מובילה בהסבה והכשרה למקצועות ההייטק. התוכנית מאתרת למידה הכוללת ואינטנסיבית מעמיקה הכשרה להם ומספקת פוטנציאל בעלי אקדמאים

יומיומית במודל Bootcamp, במשך מספר חודשים.

,Java & C#, BI בתחומי פיתוח לתפקידי המכשירים מסלולים מספר בתוכנית C/C++ & Python, Full Stack, Data Analysis ו-Data Science. בסיום המסלול נקלטים בוגרי התוכנית לתפקיד ראשון אצל לקוחותינו. במשך עשור של עשייה, הכשרנו מעל אלף אנשי הייטק שהשתלבו בהצלחה בתעשייה. התוכנית נבחרה על ידי רשות החדשנות למיזם

סיירות התכנות.

Data Science Bootcamp

Page 2: Data Science Bootcamp · Statistical hypothesis testing (t-test, z-test) •Confidence intervals. Syllabus Outline / 700 hours. ... • Introduction and demo of scikit-learn MODULE

MODULE 1: INTRODUCTION – 1 DAY

• Course outline

• What is data science and what does a data

scientist do?

• The data science pipeline

• The data science eco-system

MODULE 2: PROGRAMMING WITH PYTHON – 10 DAYS

• The python shell

• IDEs (PyCharm, Jupyter Notebook)

• Variables and data types

• Conditions and loops

• Functions

• Modules and packages

• Lists, Sets, Dictionaries and Tuples

• List comprehensions

• Debugging

• Python standard library

MODULE 3: ADVANCED PYTHON PROGRAMMING – 5 DAYS

• Lambda expressions

• Error handling

• Working with files

• Object-Oriented Programming

• Operator overloading

• Inheritance and polymorphism

• Iterators and generators

• Regular expressions

MODULE 4: NUMPY – 5 DAYS

• The numPy library

• Multi-dimensional arrays

• Indexing, slicing, operations on arrays

• Structured arrays

• Polynomials

• Calculus

• Linear algebra

• Eigenvalues and eigenvectors

• SVD

MODULE 5:GETTING AND VISUALIZING DATA – 5 DAYS

• Using pandas for loading, examining,

and manipulating data

• Working with JSON and CSV files

• Getting data from the internet (web scraping)

• Visualization with matplotlib library

MODULE 6: RELATIONAL DATABASES – 3 DAYS

• Introduction to SQL

• Retrieving data

• Updating, inserting and deleting data

• Views

MODULE 7:NON-RELATIONAL DATABASES – 2 DAYS

• NoSQL databases

• MongoDB

MODULE 8: STATISTICS AND PROBABILITY – 3 DAYS

• Central tendencies: mean, median and mode

• Variation and standard deviation

• Covariance and correlation

• Common data distributions

• Statistical hypothesis testing (t-test, z-test)

• Confidence intervals

Syllabus Outline / 700 hours

Page 3: Data Science Bootcamp · Statistical hypothesis testing (t-test, z-test) •Confidence intervals. Syllabus Outline / 700 hours. ... • Introduction and demo of scikit-learn MODULE

MODULE 9:DATA PREPARATION – 3 DAYS

• Types of data (structured vs. unstructured)

• Cleaning and normalizing data

• Dimensionality reduction

• Principal Component Analysis (PCA)

• Feature extraction and selection

• Key Performance Indicator (KPI)

MODULE 10: INTRODUCTION TO MACHINE LEARNING – 1 DAY

• Types of ML systems

• Supervised vs. unsupervised learning

• Main ML algorithms

• Overfitting and underfitting

• Cross validation

• Introduction and demo of scikit-learn

MODULE 11:REGRESSION – 2 DAYS

• Linear regression

• Polynomial regression

• Logistic regression

MODULE 12: CLASSIFICATION – 4 DAYS

• K-Nearest-Neighbors

• Decision Trees

• Nave Bayes

• Support Vector Machines (SVM)

• Ensemble methods (AdaBoost, XGBoost,

Bagging)

• Random Forests

MODULE 13:CLUSTERING – 3 DAYS

• Introduction to clustering

• K-means clustering

• Hierarchical clustering (dendograms)

• db-scan

MODULE 14: REINFORCEMENT LEARNING – 3 DAYS

• Markov Decision Process

• Temporal difference learning

• Q-learning

MODULE 15:TEXT MINING AND TEXT ANALYTICS – 3 DAYS

• Introduction to NLP

• The NLTK library

• Word vector representations

• Classifying documents

MODULE 16:DATA MINING USE CASES – 1 DAY

• Recommendation systems

MODULE 17:NEURAL NETWORKS AND DEEP LEARNING – 5 DAYS

• Introduction and history background

• Perceptrons, NN

• Feed-forward neural networks

• Backpropagation

• Using TensorFlow to train neural

networks

• Auto encoders

• Convolutional neural networks (CNNs)

• Recurrent neural networks (RNNs)

MODULE 18:BIG DATA – 5 DAYS

• Introduction to big data

• Apache Hadoop

• Map-Reduce algorithm

• Spark, SparkPy and SparkML

FINAL PROJECT – 5 DAYS

Page 4: Data Science Bootcamp · Statistical hypothesis testing (t-test, z-test) •Confidence intervals. Syllabus Outline / 700 hours. ... • Introduction and demo of scikit-learn MODULE

טלפון: 03-5686400

[email protected] דוא"ל:

90, תל אביב יגאל אלון

BIData AnalysisData Science

C/C++&PythonJava & C#Full Stack

QA & Automationהגנת סייבר

מסלולי התוכנית