Plan du cours
Introduction
Aperçu des approches d'accès aux données (Hive, bases de données, etc.)
Présentation des fonctionnalités et de l'architecture de Spark
Installation et configuration de Spark
Comprendre les dataframes dans Spark
Définir des tables et importer des ensembles de données
Interrogation de trames de données à l'aide de SQL
Réalisation d'agrégations, de JOIN et de requêtes imbriquées
Téléchargement et Accessing de données
Interroger différents types de données
- JSON, Parquet, etc.
Interroger des lacs de données avec SQL
Dépannage
Sommaire et conclusion
Pré requis
- Expérience avec SQL requêtes
- Expérience de la programmation dans n'importe quel langage
Public
- Analystes de données
- Data scientists
- Ingénieurs de données
Nos clients témoignent (5)
Beaucoup d'exemples pratiques, différentes façons d'aborder le même problème, et parfois des astuces pas si évidentes pour améliorer la solution actuelle.
Rafal - Nordea
Formation - Apache Spark MLlib
Traduction automatique
La bonne humeur, l'accompagnement et les compétences du formateur.
Oumayma - Physiobotic
Formation - Scaling Data Pipelines with Spark NLP
très interactif...
Richard Langford
Formation - SMACK Stack for Data Science
Traduction automatique
Une pratique suffisante, le formateur est compétent
Chris Tan
Formation - A Practical Introduction to Stream Processing
Traduction automatique
Découvrez le streaming Spark, Databricks et AWS Redshift
Lim Meng Tee - Jobstreet.com Shared Services Sdn. Bhd.
Formation - Apache Spark in the Cloud
Traduction automatique