Cursusaanbod
Invoering
- Inleiding tot Cloud Computing en Big Data oplossingen
- Overzicht van Apache Hadoop Functies en architectuur
Opstellen Hadoop
- Een Hadoop cluster plannen (on-premise, cloud, enz.)
- Het besturingssysteem en Hadoop distributie selecteren
- Voorzieningen voor resources (hardware, netwerk, etc.)
- Het downloaden en installeren van de software
- Het cluster op maat maken voor flexibiliteit
Werken met HDFS
- Inzicht in het Hadoop gedistribueerde bestandssysteem (HDFS)
- Overzicht van HDFS-opdrachtreferentie
- AccessHDFS inschakelen
- Basisbestandsbewerkingen uitvoeren op HDFS
- S3 gebruiken als aanvulling op HDFS
Overzicht van de MapReduce
- Gegevensstroom begrijpen in het MapReduce Framework
- In kaart brengen, shuffle, sorteren en verkleinen
- Demo: Computing-topsalarissen
Werken met GAREN
- Inzicht in hulpbronnenbeheer in Hadoop
- Werken met ResourceManager, NodeManager, Applicatiemaster
- Taken plannen onder YARN
- Planning voor grote aantallen knooppunten en clusters
- Demo: Taakplanning
Integratie van Hadoop met Spark
- Opslag instellen voor Spark (HDFS, Amazon, S3, NoSQL, etc.)
- Veerkrachtige gedistribueerde datasets (RDD's) begrijpen
- Een RDD maken
- Implementatie van RDD-transformaties
- Demo: implementatie van een tekstprogramma Search voor filmtitels
Beheer van een Hadoop cluster
- Toezicht Hadoop
- Het beveiligen van een Hadoop cluster
- Knooppunten toevoegen en verwijderen
- Het uitvoeren van een prestatiebenchmark
- Een Hadoop cluster afstemmen op het optimaliseren van de prestaties
- Back-up-, herstel- en bedrijfscontinuïteitsplanning
- Zorgen voor hoge beschikbaarheid (HA)
Een Hadoop cluster upgraden en migreren
- Beoordelen van de werklastvereisten
- Upgraden Hadoop
- Van on-premise naar de cloud en vice versa
- Herstellen van mislukkingen
Probleemoplossen
Samenvatting en conclusie
Vereisten
- Ervaring met systeembeheer
- Ervaring met de opdrachtregel Linux.
- Een goed begrip van big data-concepten
Publiek
- Systeembeheerders
- DBA's
Testimonials (5)
Veel praktijkvoorbeelden, verschillende manieren om hetzelfde probleem aan te pakken, en soms niet zo voor de hand liggende trucs om de huidige oplossing te verbeteren
Rafal - Nordea
Cursus - Apache Spark MLlib
Automatisch vertaald
very interactive...
Richard Langford
Cursus - SMACK Stack for Data Science
Sufficient hands on, trainer is knowledgable
Chris Tan
Cursus - A Practical Introduction to Stream Processing
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
Get to learn spark streaming , databricks and aws redshift