Cursusaanbod

Inleiding tot Data Analysis en Big Data

  • Wat maakt Big Data "groot"?
    • Snelheid, Volume, Verscheidenheid, Waarheidsgetrouwheid (VVVV)
  • Grenzen aan traditionele gegevensverwerking
  • Gedistribueerde verwerking
  • Statistische analyse
  • Soorten Machine Learning Analyse
  • Data Visualization

Big Data Rollen en verantwoordelijkheden

  • Beheerders
  • Ontwikkelaars
  • Data-analisten

Languages Gebruikt voor Data Analysis

  • R Language
    • Waarom R voor Data Analysis?
    • Gegevensmanipulatie, berekening en grafische weergave
  • Python
    • Waarom Python voor Data Analysis?
    • Gegevens manipuleren, verwerken, opschonen en verwerken

Benaderingen van Data Analysis

  • Statistische analyse
    • Analyse van tijdreeksen
    • Forecasting met correlatie- en regressiemodellen
    • Inferentieel Statistics (schatting)
    • Beschrijvend Statistics in Big Data sets (bijv. het berekenen van gemiddelde)
  • Machine Learning
    • Leren onder toezicht versus leren zonder toezicht
    • Classificatie en clustering
    • Schatting van de kosten van specifieke methoden
    • Filtering
  • Natuurlijke taalverwerking
    • Tekst verwerken
    • Betekenis van de tekst onderstrepen
    • Automatisch tekst genereren
    • Sentiment analyse / onderwerp analyse
  • Computer Vision
    • Afbeeldingen verwerven, verwerken, analyseren en begrijpen
    • 3D-scènes reconstrueren, interpreteren en begrijpen
    • Beeldgegevens gebruiken om beslissingen te nemen

Big Data Infrastructuur

  • Gegevensopslag
    • Relationele databases (SQL)
      • MySQL
      • Postgres
      • Oracle
    • Niet-relationele databases (NoSQL)
      • Cassandra
      • MongoDB
      • Neo4js
    • De nuances begrijpen
      • Hiërarchische databases
      • Objectgeoriënteerde databases
      • Document-georiënteerde databases
      • Grafiek-georiënteerde databases
      • Ander
  • Gedistribueerde verwerking
    • Hadoop
      • HDFS als een gedistribueerd bestandssysteem
      • MapReduce voor gedistribueerde verwerking
    • Vonk
      • Alles-in-één in-memory cluster computing-framework voor grootschalige gegevensverwerking
      • Gestructureerd streamen
      • Vonk SQL
      • Machine Learning bibliotheken: MLlib
      • Grafiekverwerking met GraphX
  • Scalabillijkheid
    • Publieke cloud
      • AWS, Google, Aliyun, enz.
    • Privécloud
      • OpenStack, Cloud Foundry, enz.
    • Automatische schaalbaarheid

De juiste oplossing voor het probleem kiezen

De toekomst van Big Data

Samenvatting en volgende stappen

Vereisten

  • Een algemeen begrip van wiskunde
  • Een algemeen begrip van programmeren
  • Een algemeen begrip van databases

Publiek

  • Ontwikkelaars / programmeurs
  • IT-consultants
 35 Uren

Aantal deelnemers


Prijs Per Deelnemer

Testimonials (7)

Voorlopige Aankomende Cursussen

Gerelateerde categorieën