HBase for Developers Training Cursus
Deze cursus introduceert HBase - een No SQL store bovenop Hadoop . De cursus is bedoeld voor ontwikkelaars die HBase gaan gebruiken om applicaties te ontwikkelen, en beheerders die HBase-clusters gaan beheren.
We zullen een ontwikkelaar door HBase-architectuur en datamodellering en applicatie-ontwikkeling op HBase leiden. Er wordt ook ingegaan op het gebruik van MapReduce met HBase en enkele beheeronderwerpen met betrekking tot prestatieoptimalisatie. De cursus is zeer praktisch met veel laboratoriumoefeningen.
Duur : 3 dagen
Publiek : ontwikkelaars en beheerders
Cursusaanbod
- Deel 1: Inleiding tot Big Data & NoSQL
- Big Data Ecosysteem
- NoSQL Overzicht
- Stelling van CAP
- Wanneer is NoSQL gepast?
- Zuilvormige opslag
- HBase en NoSQL
- Sectie 2 : HBase Intro
- Concepten en ontwerp
- Architectuur (HMaster en Region Server)
- Integriteit van gegevens
- HBase-ecosysteem
- Lab : Onderzoek naar HBase
- Sectie 3 : HBase Datamodel
- Naamruimten, tabellen en regio's
- Rijen, kolommen, kolomfamilies, versies
- HBase Shell- en Admin-opdrachten
- Laboratorium : HBase Shell
- Sectie 3 : Accessing HBase met behulp van Java API
- Inleiding tot Java API
- Lees-/schrijfpad
- Gegevens over tijdreeksen
- Scans
- Kaart verkleinen
- Filters
- Items
- Co-verwerkers
- Labs (meerdere) : HBase Java API gebruiken om tijdreeksen, Map Reduce, Filters en tellers te implementeren .
- Sectie 4 : HBase schema Ontwerp : Groepssessie
- Studenten krijgen use cases uit de echte wereld te zien
- Studenten gaan in groepjes aan de slag om ontwerpoplossingen te bedenken
- Bespreek / bekritiseer en leer van meerdere ontwerpen
- Labs : implementeer een scenario in HBase
- Sectie 5 : HBase Internals
- Inzicht in HBase onder de motorkap
- Memfile / HFile / WAL
- HDFS-opslag
- Verdichtingen
- Splitst
- Bloei Filters
- Caches
- Diagnostiek
- Sectie 6 : HBase installatie en configuratie
- Hardware selectie
- Installeer methoden
- Gemeenschappelijke configuraties
- Lab : installatie van HBase
- Sectie 7 : HBase-ecosysteem
- het ontwikkelen van applicaties met behulp van HBase
- interactie met andere Hadoop stack (MapReduce, Pig, Hive)
- frameworks rond HBase
- Geavanceerde concepten (co-processors)
- Labs : schrijven van HBase applicaties
- Deel 8 : Monitoring en beste praktijken
- Monitoringtools en -praktijken
- HBase optimaliseren
- HBase in de cloud
- gebruiksscenario's van HBase in de echte wereld
- Labo's: controle van de vitale functies van HBase
Vereisten
- vertrouwd met de Java-programmeertaal
- comfortabel in Java-programmeertaal (navigeren Linux opdrachtregel, bestanden bewerken met vi / nano)
- Een Java IDE zoals Eclipse of IntelliJ
Labomgeving:
Voor studenten wordt een werkend HBase-cluster aangeboden. Studenten hebben een SSH-client en een browser nodig om toegang te krijgen tot het cluster.
Zero Install: Het is niet nodig om HBase-software op de computers van studenten te installeren!
Voor open trainingen is een minimum aantal van 5 deelnemers vereist
HBase for Developers Training Cursus - Booking
HBase for Developers Training Cursus - Enquiry
HBase for Developers - Consultancyaanvraag
Consultancyaanvraag
Testimonials (5)
Interessante presentatie en oefeningen
Szymon - Agora SA
Cursus - Scylla Database
Automatisch vertaald
Trainer's preparation & organization, and quality of materials provided on github.
Mateusz Rek - MicroStrategy Poland Sp. z o.o.
Cursus - Impala for Business Intelligence
It gives me an insight on Redis, and also guide me to the right path if I want to know more about Redis
Ameer Fiqri Barahim - Sarawak Information Systems Sdn Bhd
Cursus - Redis for High Availability and Performance Training Course
The VM I liked very much The Teacher was very knowledgeable regarding the topic as well as other topics, he was very nice and friendly I liked the facility in Dubai.
Safar Alqahtani - Elm Information Security
Cursus - Big Data Analytics in Health
Liked very much the interactive way of learning.
Luigi Loiacono
Cursus - Data Analysis with Hive/HiveQL
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
Administrator Training for Apache Hadoop
35 UrenAudiëntie:
De cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing om grote datasets op te slaan en te verwerken in een gedistribueerde systeemomgeving
Goal:
Diepgaande kennis van Hadoop clusterbeheer.
Big Data Analytics in Health
21 UrenBig data-analyse omvat het proces van het onderzoeken van grote hoeveelheden gevarieerde gegevenssets om correlaties, verborgen patronen en andere nuttige inzichten te ontdekken.
De gezondheidsindustrie heeft enorme hoeveelheden complexe heterogene medische en klinische gegevens. Het toepassen van big data-analyses op gezondheidsgegevens biedt een enorm potentieel voor het verkrijgen van inzichten voor het verbeteren van de gezondheidszorg. De enorme omvang van deze datasets vormt echter grote uitdagingen bij analyses en praktische toepassingen in een klinische omgeving.
In deze door een instructeur geleide, live training (op afstand), leren deelnemers hoe ze big data-analyses in gezondheid kunnen uitvoeren terwijl ze een reeks praktische live-laboefeningen doorlopen.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer big data-analysehulpmiddelen zoals Hadoop MapReduce en Spark
- Begrijp de kenmerken van medische gegevens
- Pas big data-technieken toe om met medische gegevens om te gaan
- Bestudeer big data-systemen en algoritmen in het kader van gezondheidstoepassingen
Publiek
- ontwikkelaars
- Data Scientists
Indeling van de cursus
- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen.
Notitie
- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Big Data Storage Solution - NoSQL
14 UrenWanneer traditionele opslagtechnologieën niet omgaan met de hoeveelheid gegevens die u moet opslaan, zijn er honderden alternatieven. Deze cursus probeert de deelnemers te begeleiden wat alternatieven zijn voor het opslaan en analyseren van Big Data en wat hun voor- en nadelen zijn.
Deze cursus is vooral gericht op discussie en presentatie van oplossingen, hoewel praktische oefeningen op aanvraag beschikbaar zijn.
Big Data & Database Systems Fundamentals
14 UrenDe cursus maakt deel uit van de vaardigheden van Data Scientist (Domain: Data and Technology).
NoSQL Database with Microsoft Azure Cosmos DB
14 UrenDeze door een instructeur geleide, live training in België (op locatie of op afstand) is gericht op databasebeheerders of ontwikkelaars die Microsoft Azure Cosmos DB willen gebruiken om zeer responsieve toepassingen met lage latentie te ontwikkelen en te beheren.
Aan het einde van deze training kunnen deelnemers:
- Zorg voor de benodigde Cosmos DB-resources om te beginnen met het bouwen van databases en toepassingen.
- Schaal de prestaties en opslag van toepassingen door gebruik te maken van API's in Cosmos DB.
- Beheer databasebewerkingen en verlaag de kosten door Cosmos DB-resources te optimaliseren.
Hadoop Administration
21 UrenDe cursus is bedoeld voor IT-specialisten die op zoek zijn naar een oplossing om grote datasets op te slaan en te verwerken in een gedistribueerde systeemomgeving
Doel van de cursus:
Kennis opdoen met betrekking tot Hadoop clusterbeheer
Hadoop For Administrators
21 UrenApache Hadoop is het meest populaire framework voor verwerking Big Data op clusters van servers. In deze driedaagse (optioneel vier) daagse cursus leren deelnemers over de zakelijke voordelen en gebruiksscenario's voor Hadoop en het ecosysteem, hoe ze de implementatie en groei van clusters kunnen plannen, hoe ze kunnen installeren, onderhouden, monitoren, problemen oplossen en optimaliseren Hadoop. Ze zullen ook oefenen met het laden van bulkgegevens in clusters, vertrouwd raken met verschillende Hadoop distributies en oefenen met het installeren en beheren van Hadoop ecosysteemtools. De cursus wordt afgesloten met een bespreking van het beveiligen van clusters met Kerberos.
“… De materialen waren zeer goed voorbereid en grondig behandeld. Het Lab was zeer behulpzaam en goed georganiseerd"
— Andrew Nguyen, Principal Integration DW Engineer, Microsoft Online Advertising
Audiëntie
Hadoop Beheerders
Formatteren
Lezingen en hands-on labs, ongeveer 60% hoorcolleges, 40% labs.
Hadoop for Developers (4 days)
28 UrenApache Hadoop is het meest populaire framework voor verwerking Big Data op clusters van servers. In deze cursus laat een ontwikkelaar kennismaken met verschillende componenten (HDFS, MapReduce, Pig, Hive en HBase) Hadoop ecosysteem.
Advanced Hadoop for Developers
21 UrenApache Hadoop is een van de meest populaire frameworks voor verwerking Big Data op clusters van servers. Deze cursus gaat dieper in op gegevensbeheer in HDFS, advanced Pig, Hive en HBase. Deze geavanceerde programmeertechnieken zullen nuttig zijn voor ervaren Hadoop ontwikkelaars.
Doelgroep: ontwikkelaars
Duur: drie dagen
Vorm: hoorcolleges (50%) en hands-on labs (50%).
Hortonworks Data Platform (HDP) for Administrators
21 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) introduceert Hortonworks Data Platform (HDP) en leidt deelnemers door de implementatie van de Spark + Hadoop-oplossing.
Aan het einde van deze training zijn de deelnemers in staat om:
- Gebruik Hortonworks om op grote schaal betrouwbaar Hadoop uit te voeren.
- Integreer de beveiligings-, governance- en operationele mogelijkheden van Hadoop met de flexibele analytische workflows van Spark.
- Gebruik Hortonworks om elk van de componenten in een Spark-project te onderzoeken, te valideren, te certificeren en te ondersteunen.
- Verwerk verschillende soorten gegevens, waaronder gestructureerde, ongestructureerde, in-beweging en stilstaande gegevens.
Data Analysis with Hive/HiveQL
7 UrenDeze cursus behandelt het gebruik van Hive SQL taal (AKA: Hive HQL, SQL on Hive , Hive QL) voor mensen die gegevens uit Hive
Impala for Business Intelligence
21 UrenCloudera Impala is een open source massively parallel processing (MPP) SQL query engine voor Apache Hadoop clusters.
Impala stelt gebruikers in staat om SQL query's met lage latentie uit te voeren op gegevens die zijn opgeslagen in Hadoop Distributed File System en Apache Hbase zonder dat gegevensverplaatsing of -transformatie nodig is.
Audiëntie
Deze cursus is bedoeld voor analisten en datawetenschappers die analyses uitvoeren op gegevens die zijn opgeslagen in Hadoop via Business Intelligence of SQL tools.
Na afloop van deze cursus zijn de deelnemers in staat om
- Haal zinvolle informatie uit Hadoop clusters met Impala.
- Schrijf specifieke programma's om Business Intelligentie in Impala SQL Dialect te vergemakkelijken.
- Problemen oplossen Impala.
A Practical Introduction to NoSQL Databases
28 UrenRelationele databases zijn de favoriete technologie voor het opslaan, ophalen en opvragen van gegevens. Met relationele databases kunnen gebruikers hun gegevens ordenen met behulp van een gestructureerde, goed gedefinieerde set patronen (model). Hoewel deze aanpak goed werkt voor het opslaan van gegevens die vooraf zijn gestandaardiseerd en goed begrepen (denk aan een ziekenhuis check-in applicatie die patiëntendossiers bevat met dezelfde consistente set vooraf gedefinieerde velden ... patiënt-ID, voornaam, achternaam naam, datum van laatste bezoek, enz.), dit model kent beperkingen. Voor organisaties waarvan de inkomende gegevens niet goed zijn gedefinieerd (denk aan een online aanvraagformulier voor een startup die nog steeds bezig is met experimenteren met verschillende velden voor het verzamelen van bezoekersgegevens, verwijderen en toevoegen van velden als ze geschikt zijn voor de veranderende aard van de business), moeten alle vastgestelde definities voor hoe de gegevens in een bestaande database moeten passen, regelmatig opnieuw worden gedefinieerd. Dit vereist het opnieuw maken van het gegevensmodel (schema) dat de structuur van de gegevens en de toegestane gegevenstypen dicteert om verschillende soorten gegevensinvoer, enz. Te ondersteunen, voordat nieuwe gegevens in de database kunnen worden opgeslagen.
Voer geen SQL databases (niet alleen SQL ) in. Geen enkele SQL database bevrijdt gebruikers van het vooraf definiëren van de structuur van de inkomende gegevens, waardoor ze nieuwe gegevens direct kunnen invoegen en bijwerken. Geen SQL databases zijn vaak sneller dan relationele databases en kunnen met gemak zeer grote hoeveelheden gegevens verwerken. Geen SQL databases zijn ook beter schaalbaar dan relationele databases, vanwege hun vermogen om gegevens efficiënt over vele servers (cluster) te verdelen en de toegang tot deze gegevens te verdelen. Geen SQL databases integreren bijzonder goed met applicaties die realtime analyse, site-personalisatie, IoT en mobiele apps ondersteunen
In deze door een instructeur geleide, live training, zullen deelnemers de architectuur, ontwerpprincipes en functionaliteit van de meest populaire No SQL databases op de markt begrijpen tijdens het opzetten, beheren en beoordelen van een aantal No SQL databases in een live lab-omgeving. Het doel van deze training is om deelnemers uit te rusten met de mogelijkheid om op intelligente wijze een geschikte No SQL database-oplossing in hun organisatie te evalueren, voor te stellen en te implementeren.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer verschillende soorten No SQL databases, waaronder MongoDB , Cassandra , Redis en Neo4j
- Begrijp de voor- en nadelen van Geen SQL databases versus relationele databases
- Begrijp de onderliggende gegevensindelingen die worden gebruikt door No SQL databases en hoe deze indelingen in een voordeel kunnen worden gebruikt bij het ontwikkelen van moderne applicaties (desktop, mobiel, cloud, IoT)
- Bewerkingen uitvoeren, invoegen, bijwerken, verwijderen in een No SQL database
- Stel een gemengde omgeving in met zowel een relationele database als Geen SQL werkt
- Configureer een cluster van Geen SQL database voor gedistribueerde verwerking van zeer grote gegevenssets
- Begrijp de beveiligingsimplicaties van het gebruik van een No SQL database
- Implementeer en schaal een No SQL database in een productieomgeving
Publiek
- Database professionals
- Gegevensarchitecten
- Gegevensstrategen
- Project managers
- Applicatieontwikkelaars die een flexibele databaseoplossing in hun applicatie willen integreren
Indeling van de cursus
- Deelcollege, deelbespreking, oefeningen en zware praktijkoefeningen
Notitie
- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Scylla Database
21 UrenScylla is een open-source gedistribueerde No SQL data store. Het is compatibel met Apache Cassandra maar presteert bij aanzienlijk hogere doorvoer en lagere latenties.
In deze cursus leren deelnemers over de functies en architectuur van Scylla, terwijl ze praktische ervaring opdoen met het opzetten, beheren, bewaken en oplossen van problemen met Scylla.
Publiek
- Database beheerders
- ontwikkelaars
- Systeem ingenieurs
Formaat van de cursus
- De cursus is interactief en bevat discussies over de principes en benaderingen voor het implementeren en beheren van door Scylla verspreide databases en clusters.
- De cursus omvat een zwaar onderdeel van praktische oefeningen en oefeningen.