Plan du cours

Avancées en Analytique avec Spark

Big Data dans le Cloud

Études de cas et Meilleures Pratiques


Traitement des Données avec Apache Spark


Introduction à Google Colab et Apache Spark


Optimisation des Flux de Travail Big Data


Résumé et Étapes Suivantes


Visualisation et Collaboration dans Google Colab

  • Intégration de Colab avec des bibliothèques de visualisation populaires
  • Flux de travail collaboratif avec les cahiers Colab
  • Partage et exportation des résultats
  • Intégration de Google Colab avec des outils basés sur le cloud
  • Utilisation du stockage dans le cloud pour les grands volumes de données
  • Travail avec Spark dans des environnements de cloud distribués
  • Apprentissage automatique avec Spark MLlib
  • Analyse en temps réel des données
  • Calcul distribué avec Spark
  • Aperçu de Google Colab
  • Introduction à Apache Spark
  • Configuration de Spark dans Google Colab
  • Revue des applications de données massives en temps réel
  • Études de cas utilisant Apache Spark et Colab
  • Meilleures pratiques pour l'analyse des grands volumes de données
  • Ajustement de Spark pour les performances
  • Optimisation de l'utilisation de la mémoire et du stockage
  • Échelle des flux de travail pour de grands ensembles de données
  • Travail avec RDDs et DataFrames
  • Chargement et traitement d'ensembles de données volumineux
  • Utilisation de Spark SQL pour interroger les données structurées

Pré requis

Public cible

  • Connaissance de base des concepts de science des données
  • Familiarité avec Apache Spark
  • Compétences en programmation Python
  • Scientifiques des données
  • Ingénieurs des données
  • Chercheurs travaillant avec de grandes masses de données
 14 Heures

Nombre de participants


Prix ​​par Participant

Nos clients témoignent (5)

Cours à venir

Catégories Similaires