Bedankt voor uw aanvraag! Een van onze medewerkers neemt binnenkort contact met u op
Bedankt voor uw boeking! Een van onze medewerkers neemt binnenkort contact met u op.
Cursusaanbod
1: HDFS (17%)
- Beschrijf de functie van HDFS-daemons
- Beschrijf de normale werking van een Apache Hadoop cluster, zowel bij gegevensopslag als bij gegevensverwerking.
- Identificeer de huidige kenmerken van computersystemen die een systeem als Apache motiveren Hadoop.
- Classificeer de belangrijkste doelen van HDFS Design
- Identificeer op basis van een scenario de juiste use case voor HDFS Federation
- Identificeer componenten en daemon van een HDFS HA-Quorum-cluster
- Analyseer de rol van HDFS-beveiliging (Kerberos)
- Bepaal de beste keuze voor gegevensserialisatie voor een bepaald scenario
- Lees- en schrijfpaden voor bestanden beschrijven
- Identificeer de opdrachten om bestanden te manipuleren in de Hadoop File System Shell
2: YARN en MapReduce versie 2 (MRv2) (17%)
- Begrijpen hoe het upgraden van een cluster van Hadoop 1 naar Hadoop 2 van invloed is op de clusterinstellingen
- Begrijpen hoe je MapReduce v2 (MRv2 / YARN) implementeert, inclusief alle YARN-daemons
- Inzicht in de basisontwerpstrategie voor MapReduce v2 (MRv2)
- Bepaal hoe YARN omgaat met de toewijzing van middelen
- Identificeer de workflow van MapReduce-taken die op YARN worden uitgevoerd
- Bepaal welke bestanden u moet wijzigen en hoe u een cluster wilt migreren van MapReduce versie 1 (MRv1) naar MapReduce versie 2 (MRv2) die op YARN draait.
3: Hadoop Cluster planning (16%)
- De belangrijkste punten waarmee rekening moet worden gehouden bij het kiezen van de hardware en besturingssystemen om een Apache Hadoop-cluster te hosten.
- Analyseer de keuzes bij het selecteren van een besturingssysteem
- Inzicht in kernelafstemming en schijfverwisseling
- Identificeer op basis van een scenario en workloadpatroon een hardwareconfiguratie die geschikt is voor het scenario
- Bepaal op basis van een scenario de ecosysteemcomponenten die uw cluster moet uitvoeren om aan de SLA te voldoen
- Clustergrootte: op basis van een scenario en frequentie van uitvoering, identificeert u de specifieke kenmerken voor de workload, inclusief CPU, geheugen, opslag, schijf-I/O
- Schijfgrootte en -configuratie, inclusief JBOD versus RAID, SAN's, virtualisatie en vereisten voor schijfgrootte in een cluster
- Netwerktopologieën: begrijp het netwerkgebruik in Hadoop (voor zowel HDFS als MapReduce) en stel belangrijke netwerkontwerpcomponenten voor een bepaald scenario voor of identificeer deze
4: Hadoop Installatie en beheer van clusters (25%)
- Bepaal op basis van een scenario hoe het cluster omgaat met schijf- en machinefouten
- Een bestandsindeling voor logboekregistratie en logboekconfiguratie analyseren
- Inzicht in de basisprincipes van Hadoop metrische gegevens en bewaking van de clusterstatus
- Identificeer de functie en het doel van beschikbare tools voor clusterbewaking
- In staat zijn om alle ecosysteemcomponenten in CDH 5 te installeren, inclusief (maar niet beperkt tot): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive en Pig
- Identificeer de functie en het doel van de beschikbare tools voor het beheer van het Apache Hadoop bestandssysteem
5: Bron Management (10%)
- Inzicht krijgen in de algemene ontwerpdoelen van elk van Hadoop planners
- Bepaal op basis van een scenario hoe de FIFO-planner clusterresources toewijst
- Bepaal op basis van een scenario hoe de Fair Scheduler clusterresources toewijst onder YARN
- Bepaal op basis van een scenario hoe de capaciteitsplanner clusterresources toewijst
6: Monitoren en loggen (15%)
- Inzicht krijgen in de functies en kenmerken van de mogelijkheden voor het verzamelen van metrische gegevens van Hadoop
- Analyseer de web-UI's van NameNode en JobTracker
- Begrijpen hoe je clusterdaemons kunt bewaken
- CPU-gebruik op hoofdknooppunten identificeren en bewaken
- Beschrijf hoe u swap en geheugentoewijzing op alle knooppunten kunt bewaken
- Bepalen hoe u de logbestanden van Hadoop kunt weergeven en beheren
- Een logbestand interpreteren
Vereisten
- Basis Linux administratieve vaardigheden
- Basis programmeervaardigheden
35 Uren
Testimonials (3)
I genuinely enjoyed the many hands-on sessions.
Jacek Pieczatka
Cursus - Administrator Training for Apache Hadoop
I genuinely enjoyed the big competences of Trainer.
Grzegorz Gorski
Cursus - Administrator Training for Apache Hadoop
I mostly liked the trainer giving real live Examples.