Cursusaanbod
Deel 1: Data Management in HDFS
- Verschillende gegevensformaten (JSON / Avro / Parquet)
- Compressie schema's
- Gegevens maskeren
- Labs : Analyseren van verschillende dataformaten; Compressie inschakelen
Deel 2: Geavanceerd varken
- Door de gebruiker gedefinieerde functies
- Inleiding tot varkensbibliotheken (ElephantBird / Data-Fu)
- Laden van complexe gestructureerde gegevens met behulp van Pig
- Varken Tuning
- Labs : geavanceerde pig scripting, het ontleden van complexe datatypes
Deel 3 : Gevorderden Hive
- Door de gebruiker gedefinieerde functies
- Gecomprimeerde tabellen
- Hive Prestaties afstemmen
- Labs : maken van gecomprimeerde tabellen, evalueren van tabelformaten en configuratie
Deel 4 : Gevorderd HBase
- Geavanceerde schemamodellering
- Compressie
- Bulksgewijs gegevens opnemen
- Vergelijking van brede tafel / hoge tafel
- HBase en varken
- HBase en Hive
- HBase Prestaties Tuning
- Labs : HBase afstemmen; toegang tot HBase-gegevens van Pig & Hive; Phoenix gebruiken voor gegevensmodellering
Vereisten
- Vertrouwd met Java programmeertaal (de meeste programmeeroefeningen zijn in Java)
- Comfortabel in Linux omgeving (in staat zijn om te navigeren Linux opdrachtregel, bestanden bewerken met VI / Nano)
- een praktische kennis van Hadoop.
Lab-omgeving
Zero Install: Het is niet nodig om Hadoop-software te installeren op de computers van studenten! Voor de studenten wordt een werkende hadoop-cluster voorzien.
Studenten hebben het volgende nodig
- een SSH-client (Linux en Mac hebben al ssh-clients, voor Windows wordt Putty aanbevolen)
- een browser om toegang te krijgen tot het cluster. We raden de Firefox-browser aan
Testimonials (5)
The live examples
Ahmet Bolat - Accenture Industrial SS
Cursus - Python, Spark, and Hadoop for Big Data
During the exercises, James explained me every step whereever I was getting stuck in more detail. I was completely new to NIFI. He explained the actual purpose of NIFI, even the basics such as open source. He covered every concept of Nifi starting from Beginner Level to Developer Level.
Firdous Hashim Ali - MOD A BLOCK
Cursus - Apache NiFi for Administrators
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
That I had it in the first place.
Peter Scales - CACI Ltd
Cursus - Apache NiFi for Developers
practical things of doing, also theory was served good by Ajay