Plan du cours
Semaine 1 Big Data concepts
- Définition de VVVV (Vélocité, Volume, Variété, Véracité)
- Limites de la capacité traditionnelle de traitement des données
- Traitement distribué
- Analyse statistique
- Machine Learning Types d'analyse
- Data Visualization
- Traitement distribué (par ex. map-reduce)
- Introduction aux langages utilisés
- Cours accéléré sur le langage R
- Python cours accéléré
Semaines 2&3 Exécution Data Analysis
- Analyse statistique
- Descriptive Statistics dans Big Data ensembles (par exemple, calcul de la moyenne)
- Inférentielle Statistics (estimation)
- Forecasting avec des modèles de corrélation et de régression
- Analyse des séries temporelles
- Notions de base Machine Learning
- Apprentissage supervisé ou non supervisé
- Classification et regroupement
- Estimation du coût des méthodes spécifiques
- Filtre
Semaine 4 Traitement du langage naturel
- Traitement du texte
- Comprendre le sens du texte
- Génération automatique de texte
- Analyse du sentiment/sujet
- Computer Vision
Semaine 5&6 Concept d'outil
- Solution de stockage de données (SQL, NoSQL, hiérarchique, orienté objet, orienté document)
- (par exemple, HDFS MySQL, Cassandra, MongoDB, Elasticsearch, etc...)
- Choisir la bonne solution au problème
- Traitement distribué
- Spark
- Machine Learning avec Spark (MLLib)
- Spark SQL
- Scalabilité
- Cloud public (AWS, Google, etc...)
- Cloud privé (OpenStack, cloud foundry)
- Autoscalabilité
Semaine 7 Soft Skills
- Conseil et Leadership compétences
- Avoir un impact : raconter des histoires basées sur des données
- Comprendre son public
- Présentation efficace des données - faire passer votre message
- Efficacité de l'influence et conduite du changement
- Gérer les situations difficiles
Examen de fin d'études
- Examen de fin de programme
Pré requis
Les participants doivent avoir de bonnes bases en mathématiques, au moins au niveau du lycée.
Il n'est pas nécessaire d'avoir des compétences en programmation, mais toute compétence en la matière sera utile.
Les participants seront évalués et interrogés avant de participer à ce programme de formation.
Nos clients témoignent (4)
Understanding big data beter
Shaune Dennis - Vodacom
Formation - Big Data Business Intelligence for Telecom and Communication Service Providers
Subject presentation knowledge timing
Aly Saleh - FAB banak Egypt
Formation - Introduction to Data Science and AI (using Python)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Formation - Jupyter for Data Science Teams
The example and training material were sufficient and made it easy to understand what you are doing.