Cursusaanbod
- Machine Learning Inleiding
- Soorten machine learning – leren onder toezicht versus leren zonder toezicht
- Van statistisch leren naar machine learning
- De Data Mining werkstroom:
- Business Begrijpen
- Inzicht in gegevens
- Voorbereiding van de gegevens
- Modellering
- Evaluatie
- Implementatie
- Machine learning-algoritmen
- Het kiezen van het juiste algoritme voor het probleem
- Overfitting en afweging tussen bias en variantie in ML
- ML-bibliotheken en programmeertalen
- Waarom een programmeertaal gebruiken?
- Kiezen tussen R en Python
- Python Spoedcursus
- Python Bronnen
- Python Bibliotheken voor machinaal leren
- Jupyter-notebooks en interactief coderen
- ML-algoritmen testen
- Generalisatie en overfitting
- Overfitting vermijden
- Holdout-methode
- Kruisvalidatie
- Bootstrapping
- Numerieke voorspellingen evalueren
- Metingen van nauwkeurigheid: ME, MSE, RMSE, MAPE
- Stabiliteit van parameters en voorspellingen
- Evaluatie van classificatie-algoritmen
- Nauwkeurigheid en zijn problemen
- De verwarringsmatrix
- Probleem met onevenwichtige klassen
- Modelprestaties visualiseren
- Winstcurve
- ROC-curve
- De kromme van de lift
- Model selectie
- Modelafstemming – strategieën voor het zoeken naar rasters
- Voorbeelden in Python
- Voorbereiding van de gegevens
- Gegevens importeren en opslaan
- Begrijp de gegevens – basisverkenningen
- Gegevensmanipulatie met de Pandas-bibliotheek
- Datatransformaties – Data wrangling
- Verkennende analyse
- Ontbrekende waarnemingen – detectie en oplossingen
- Uitschieters – detectie en strategieën
- Standaardisatie, normalisatie, binarisatie
- Kwalitatieve hercodering van gegevens
- Voorbeelden in Python
- Classificatie
- Binaire versus classificatie met meerdere klassen
- Classificatie via wiskundige functies
- Lineaire discriminant functies
- Kwadratische discriminant functies
- Logistische regressie- en waarschijnlijkheidsbenadering
- K-dichtstbijzijnde buren
- Naïeve Bayes
- Beslisbomen
- KAR
- Zakken
- Random Forests
- Stimuleren
- Xgboost
- Ondersteuning van Vector Machines en kernels
- Classificatie van maximale marge
- Ondersteuning Vector Machine
- Ensemble leren
- Voorbeelden in Python
- Regressie en numerieke voorspelling
- Schatting van de kleinste kwadraten
- Technieken voor het selecteren van variabelen
- Regularisatie en stabiliteit - L1, L2
- Niet-lineariteiten en gegeneraliseerde kleinste kwadraten
- Polynomiale regressie
- Regressie splines
- Regressie bomen
- Voorbeelden in Python
- Leren zonder toezicht
- Clustering
- Clustering op basis van zwaartepunt - k-gemiddelden, k-medoids, PAM, CLARA
- Hiërarchische clustering – Diana, Agnes
- Modelgebaseerde clustering - EM
- Zelforganiserende kaarten
- Clusters evaluatie en beoordeling
- Dimensionaliteit reductie
- Hoofdcomponentenanalyse en factoranalyse
- Ontleding van enkelvoudige waarden
- Multidimensionale schaling
- Voorbeelden in Python
- Clustering
- Tekst mining
- Voorbewerking van gegevens
- Het zak-van-woorden-model
- Stamming en lemmisatie
- Woordfrequenties analyseren
- Sentiment analyse
- Woordwolken maken
- Voorbeelden in Python
- Aanbevelingsengines en gezamenlijk filteren
- Aanbevelingen gegevens
- Op gebruikers gebaseerd gezamenlijk filteren
- Gezamenlijk filteren op basis van items
- Voorbeelden in Python
- Associatie patroon mijnbouw
- Algoritme voor frequente itemsets
- Analyse van het marktmandje
- Voorbeelden in Python
- Analyse van uitschieters
- Analyse van extreme waarden
- Detectie van uitschieters op basis van afstand
- Methoden op basis van dichtheid
- Detectie van hoogdimensionale uitschieters
- Voorbeelden in Python
- Machine Learning Casestudy
- Business Probleem begrijpen
- Voorbewerking van gegevens
- Selectie en afstemming van algoritmen
- Evaluatie van de bevindingen
- Implementatie
Vereisten
Kennis en bewustzijn van Machine Learning grondbeginselen
Testimonials (3)
Even with having to miss a day due to customer meetings, I feel I have a much clearer understanding of the processes and techniques used in Machine Learning and when I would use one approach over another. Our challenge now is to practice what we have learned and start to apply it to our problem domain
Richard Blewett - Rock Solid Knowledge Ltd
Cursus - Machine Learning – Data science
I like that training was focused on examples and coding. I thought that it is impossible to pack so much content into three days of training, but I was wrong. Training covered many topics and everything was done in a very detailed manner (especially tuning of model's parameters - I didn't expected that there will be a time for this and I was gratly surprised).
Bartosz Rosiek - GE Medical Systems Polska Sp. Zoo
Cursus - Machine Learning – Data science
It is showing many methods with pre prepared scripts- very nicely prepared materials & easy to traceback