Cursusaanbod

1: HDFS (17%)

  • Beschrijf de functie van HDFS-daemons
  • Beschrijf de normale werking van een Apache Hadoop cluster, zowel bij gegevensopslag als bij gegevensverwerking.
  • Identificeer de huidige kenmerken van computersystemen die een systeem als Apache motiveren Hadoop.
  • Classificeer de belangrijkste doelen van HDFS Design
  • Identificeer op basis van een scenario de juiste use case voor HDFS Federation
  • Identificeer componenten en daemon van een HDFS HA-Quorum-cluster
  • Analyseer de rol van HDFS-beveiliging (Kerberos)
  • Bepaal de beste keuze voor gegevensserialisatie voor een bepaald scenario
  • Lees- en schrijfpaden voor bestanden beschrijven
  • Identificeer de opdrachten om bestanden te manipuleren in de Hadoop File System Shell

2: YARN en MapReduce versie 2 (MRv2) (17%)

  • Begrijpen hoe het upgraden van een cluster van Hadoop 1 naar Hadoop 2 van invloed is op de clusterinstellingen
  • Begrijpen hoe je MapReduce v2 (MRv2 / YARN) implementeert, inclusief alle YARN-daemons
  • Inzicht in de basisontwerpstrategie voor MapReduce v2 (MRv2)
  • Bepaal hoe YARN omgaat met de toewijzing van middelen
  • Identificeer de workflow van MapReduce-taken die op YARN worden uitgevoerd
  • Bepaal welke bestanden u moet wijzigen en hoe u een cluster wilt migreren van MapReduce versie 1 (MRv1) naar MapReduce versie 2 (MRv2) die op YARN draait.

3: Hadoop Cluster planning (16%)

  • De belangrijkste punten waarmee rekening moet worden gehouden bij het kiezen van de hardware en besturingssystemen om een Apache Hadoop-cluster te hosten.
  • Analyseer de keuzes bij het selecteren van een besturingssysteem
  • Inzicht in kernelafstemming en schijfverwisseling
  • Identificeer op basis van een scenario en workloadpatroon een hardwareconfiguratie die geschikt is voor het scenario
  • Bepaal op basis van een scenario de ecosysteemcomponenten die uw cluster moet uitvoeren om aan de SLA te voldoen
  • Clustergrootte: op basis van een scenario en frequentie van uitvoering, identificeert u de specifieke kenmerken voor de workload, inclusief CPU, geheugen, opslag, schijf-I/O
  • Schijfgrootte en -configuratie, inclusief JBOD versus RAID, SAN's, virtualisatie en vereisten voor schijfgrootte in een cluster
  • Netwerktopologieën: begrijp het netwerkgebruik in Hadoop (voor zowel HDFS als MapReduce) en stel belangrijke netwerkontwerpcomponenten voor een bepaald scenario voor of identificeer deze

4: Hadoop Installatie en beheer van clusters (25%)

  • Bepaal op basis van een scenario hoe het cluster omgaat met schijf- en machinefouten
  • Een bestandsindeling voor logboekregistratie en logboekconfiguratie analyseren
  • Inzicht in de basisprincipes van Hadoop metrische gegevens en bewaking van de clusterstatus
  • Identificeer de functie en het doel van beschikbare tools voor clusterbewaking
  • In staat zijn om alle ecosysteemcomponenten in CDH 5 te installeren, inclusief (maar niet beperkt tot): Impala, Flume, Oozie, Hue, Manager, Sqoop, Hive en Pig
  • Identificeer de functie en het doel van de beschikbare tools voor het beheer van het Apache Hadoop bestandssysteem

5: Bron Management (10%)

  • Inzicht krijgen in de algemene ontwerpdoelen van elk van Hadoop planners
  • Bepaal op basis van een scenario hoe de FIFO-planner clusterresources toewijst
  • Bepaal op basis van een scenario hoe de Fair Scheduler clusterresources toewijst onder YARN
  • Bepaal op basis van een scenario hoe de capaciteitsplanner clusterresources toewijst

6: Monitoren en loggen (15%)

  • Inzicht krijgen in de functies en kenmerken van de mogelijkheden voor het verzamelen van metrische gegevens van Hadoop
  • Analyseer de web-UI's van NameNode en JobTracker
  • Begrijpen hoe je clusterdaemons kunt bewaken
  • CPU-gebruik op hoofdknooppunten identificeren en bewaken
  • Beschrijf hoe u swap en geheugentoewijzing op alle knooppunten kunt bewaken
  • Bepalen hoe u de logbestanden van Hadoop kunt weergeven en beheren
  • Een logbestand interpreteren

Vereisten

  • Basis Linux administratieve vaardigheden
  • Basis programmeervaardigheden
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (3)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën