Cursusaanbod

Deel 1: Data Management in HDFS

  • Verschillende gegevensformaten (JSON / Avro / Parquet)
  • Compressie schema's
  • Gegevens maskeren
  • Labs : Analyseren van verschillende dataformaten;  Compressie inschakelen

Deel 2: Geavanceerd varken

  • Door de gebruiker gedefinieerde functies
  • Inleiding tot varkensbibliotheken (ElephantBird / Data-Fu)
  • Laden van complexe gestructureerde gegevens met behulp van Pig
  • Varken Tuning
  • Labs : geavanceerde pig scripting, het ontleden van complexe datatypes

Deel 3 : Gevorderden Hive

  • Door de gebruiker gedefinieerde functies
  • Gecomprimeerde tabellen
  • Hive Prestaties afstemmen
  • Labs : maken van gecomprimeerde tabellen, evalueren van tabelformaten en configuratie

Deel 4 : Gevorderd HBase

  • Geavanceerde schemamodellering
  • Compressie
  • Bulksgewijs gegevens opnemen
  • Vergelijking van brede tafel / hoge tafel
  • HBase en varken
  • HBase en Hive
  • HBase Prestaties Tuning
  • Labs : HBase afstemmen; toegang tot HBase-gegevens van Pig & Hive; Phoenix gebruiken voor gegevensmodellering

Vereisten

  • Vertrouwd met Java programmeertaal (de meeste programmeeroefeningen zijn in Java)
  • Comfortabel in Linux omgeving (in staat zijn om te navigeren Linux opdrachtregel, bestanden bewerken met VI / Nano)
  • een praktische  kennis van Hadoop.

Lab-omgeving

Zero Install: Het is niet nodig om Hadoop-software te installeren op de computers van studenten! Voor de studenten wordt een werkende hadoop-cluster voorzien.

Studenten hebben het volgende nodig

  • een SSH-client (Linux en Mac hebben al ssh-clients, voor Windows wordt Putty aanbevolen)
  • een browser om toegang te krijgen tot het cluster. We raden de Firefox-browser aan 
 21 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (5)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën