Cursusaanbod

Deel 1: Inleiding tot Hadoop

  • Geschiedenis en concepten van Hadoop
  • Ecosysteem
  • Distributies
  • Hoge-niveau architectuur
  • Hadoop mythen
  • Hadoop uitdagingen
  • Hardware / software
  • lab : eerste kijk op Hadoop

Deel 2: HDFS

  • Ontwerp en architectuur
  • Concepten (horizontale schaling, replicatie, data-localiteit, rack-awareness)
  • Daemons : Namenode, Secondary namenode, Data node
  • Communicaties / heart-beats
  • Data-integriteit
  • Lees- en schrijfpad
  • Namenode High Availability (HA), Federatie
  • labs : Interactie met HDFS

Deel 3 : Map Reduce

  • Concepten en architectuur
  • daemons (MRV1) : jobtracker / tasktracker
  • Fasen : driver, mapper, shuffle/sort, reducer
  • Map Reduce Versie 1 en Versie 2 (YARN)
  • Interne onderdelen van Map Reduce
  • Inleiding tot het Java Map Reduce-programma
  • labs : Een voorbeeld van een MapReduce-programma uitvoeren

Deel 4 : Varken

  • Varken versus Java-kaart verminderen
  • De Stroom van de Taak van het varken
  • varken Latijnse taal
  • ETL met varken
  • Transformaties en joins
  • Door de gebruiker gedefinieerde functies (UDF)
  • labs : schrijven van Pig scripts om data te analyseren

Deel 5: Hive

  • Architectuur en design
  • Gegevenstypen
  • SQL Ondersteuning in Hive
  • Tabellen maken Hive en query's uitvoeren
  • Partities
  • Joins
  • Tekstverwerking
  • labs : diverse labo's over het verwerken van data met Hive

Deel 6: HBase

  • Concepten en architectuur
  • HBase vs RDBMS vs Cassandra
  • HBase Java API
  • Tijdreeksdata op HBase
  • Schemadesign
  • labs : Interactie met HBase via shell; programmeren in HBase Java API ; oefening schemadesign

Vereisten

  • Comfortabel met Java programmeertaal (de meeste programmeeroefeningen zijn in Java)
  • Comfortabel in Linux omgeving (in staat zijn om te navigeren Linux opdrachtregel, bestanden bewerken met VI / Nano)

Lab-omgeving

Zero Install : Er is geen behoefte om Hadoop software te installeren op de machines van de studenten! Er wordt een werkende Hadoop cluster voor de studenten beschikbaar gesteld.

Studenten hebben het volgende nodig

  • einen SSH-client (Linux en Mac hebben al ssh-clients, voor Windows wordt Putty aanbevolen)
  • einen browser om toegang te krijgen tot de cluster, Firefox wordt aanbevolen
 28 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën