Plan du cours
Introduction
- Vue d'ensemble de Spark et Hadoop caractéristiques et architecture
- Comprendre le big data
- Python bases de la programmation
Pour commencer
- Configurer Python, Spark et Hadoop
- Comprendre les structures de données dans Python
- Comprendre l'API PySpark
- Comprendre HDFS et MapReduce
Intégrer Spark et Hadoop à Python
- Implémenter Spark RDD dans Python
- Traiter les données à l'aide de MapReduce
- Créer des ensembles de données distribués dans HDFS
Spark et Spark MLlib Machine Learning avec Spark MLlib
Traiter Big Data avec Spark Streaming
Travailler avec des systèmes de recommandation
Travailler avec Kafka, Sqoop, Kafka et Flume
Apache Mahout avec Spark et Hadoop
Résolution des problèmes
Résumé et prochaines étapes
Pré requis
- Expérience avec Spark et Hadoop
- Python expérience en programmation
Audience
- Scientifiques des données
- Développeurs
Nos clients témoignent (3)
Le fait que nous ayons pu emporter la plupart des informations/du cours/de la présentation/des exercices réalisés, afin de les réviser et peut-être refaire ce que nous n'avions pas compris la première fois ou améliorer ce que nous avons déjà fait.
Raul Mihail Rat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
J'ai aimé qu'il parvienne à poser les bases du sujet et aborder des exercices assez avancés. Il a également fourni des méthodes simples pour rédiger et tester le code.
Ionut Goga - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique
Les exemples en direct
Ahmet Bolat - Accenture Industrial SS
Formation - Python, Spark, and Hadoop for Big Data
Traduction automatique