Apache Airflow for Data Science: Automating Machine Learning Pipelines Training Cursus
Apache Airflow is een open-source platform voor het orkestreren van workflows en het automatiseren van complexe datapijplijnen.
Deze live training onder leiding van een instructeur (online of ter plaatse) is bedoeld voor deelnemers van gemiddeld niveau die machine learning-workflows willen automatiseren en beheren, inclusief modeltraining, validatie en implementatie met behulp van Apache Airflow.
Aan het einde van deze training zijn de deelnemers in staat om:
- Stel Apache Airflow in voor machine learning-werkstroomorkestratie.
- Automatiseer gegevensverwerking, modeltraining en validatietaken.
- Integreer Airflow met machine learning-frameworks en -tools.
- Implementeer machine learning-modellen met behulp van geautomatiseerde pijplijnen.
- Bewaak en optimaliseer machine learning-workflows in productie.
Vorm van de cursus
- Interactieve lezing en discussie.
- Veel oefeningen en oefenen.
- Hands-on implementatie in een live-lab omgeving.
Opties voor het aanpassen van cursussen
- Om een training op maat voor deze cursus aan te vragen, neem dan contact met ons op om een afspraak te maken.
Cursusaanbod
Inleiding tot Apache Airflow voor Machine Learning
- Overzicht van Apache Airflow en de relevantie ervan voor data science
- Belangrijkste functies voor het automatiseren van machine learning-workflows
- Airflow inrichten voor data science projecten
Bouwen Machine Learning Pijpleidingen met luchtstroom
- DAG's ontwerpen voor end-to-end ML-workflows
- Operators gebruiken voor gegevensopname, voorbewerking en functie-engineering
- Pijplijnafhankelijkheden plannen en beheren
Training en validatie van modellen
- Trainingstaken voor modellen automatiseren met Airflow
- Luchtstroom integreren met ML-frameworks (bijv. TensorFlow, PyTorch)
- Modellen valideren en evaluatiestatistieken opslaan
Modelimplementatie en -bewaking
- Machine learning-modellen implementeren met behulp van geautomatiseerde pijplijnen
- Geïmplementeerde modellen bewaken met Airflow-taken
- Omscholing en modelupdates afhandelen
Geavanceerde aanpassing en integratie
- Aangepaste operators ontwikkelen voor ML-specifieke taken
- Integratie van Airflow met cloudplatforms en ML-services
- Airflow-workflows uitbreiden met plug-ins en sensoren
ML-pijplijnen optimaliseren en schalen
- Verbetering van de workflowprestaties voor grootschalige gegevens
- Opschalen van Airflow-implementaties met Celery en Kubernetes
- Best practices voor ML-workflows op productieniveau
Casestudy's en praktische toepassingen
- Praktijkvoorbeelden van ML-automatisering met behulp van Airflow
- Hands-on oefening: Het bouwen van een end-to-end ML-pijplijn
- Bespreking van uitdagingen en oplossingen in ML-workflowbeheer
Samenvatting en volgende stappen
Vereisten
- Bekendheid met machine learning-workflows en -concepten
- Basiskennis van Apache Airflow, met inbegrip van interne adviesgroepen en exploitanten
- Vaardigheid in Python programmeren
Audiëntie
- Datawetenschappers
- Ingenieurs voor machine learning
- AI-ontwikkelaars
Voor open trainingen is een minimum aantal van 5 deelnemers vereist
Apache Airflow for Data Science: Automating Machine Learning Pipelines Training Cursus - Booking
Apache Airflow for Data Science: Automating Machine Learning Pipelines Training Cursus - Enquiry
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
AdaBoost Python for Machine Learning
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en software-ingenieurs die AdaBoost willen gebruiken om boosting-algoritmen voor machine learning te bouwen met Python.
Aan het einde van deze training zijn de deelnemers in staat om:
- Stel de benodigde ontwikkelomgeving in om te beginnen met het bouwen van machine learning-modellen met AdaBoost.
- Begrijp de aanpak van ensembleleren en hoe u adaptieve versterking kunt implementeren.
- Leer hoe u AdaBoost-modellen bouwt om machine learning-algoritmen te stimuleren in Python.
- Gebruik hyperparameterafstemming om de nauwkeurigheid en prestaties van AdaBoost-modellen te verbeteren.
Anaconda Ecosystem for Data Scientists
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers die het Anaconda-ecosysteem willen gebruiken om pakketten en workflows voor gegevensanalyse vast te leggen, te beheren en te implementeren in één enkel platform.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Anaconda componenten en bibliotheken.
- Begrijp de kernconcepten, kenmerken en voordelen van Anaconda.
- Beheer pakketten, omgevingen en kanalen met behulp van Anaconda Navigator.
- Gebruik Conda-, R- en Python-pakketten voor datawetenschap en machine learning.
- Maak kennis met enkele praktische use cases en technieken voor het beheren van meerdere data-omgevingen.
AutoML with Auto-Keras
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is gericht op zowel datawetenschappers als minder technische personen die Auto-Keras willen gebruiken om het proces van het selecteren en optimaliseren van een machine learning-model te automatiseren.
Aan het einde van deze training zijn de deelnemers in staat om:
- Automatiseer het proces van het trainen van zeer efficiënte machine learning-modellen.
- Zoek automatisch naar de beste parameters voor deep learning-modellen.
- Bouw zeer nauwkeurige machine learning-modellen.
- Gebruik de kracht van machine learning om echte zakelijke problemen op te lossen.
AutoML
14 UrenDeze live training in België (online of ter plaatse) onder leiding van een instructeur is bedoeld voor technische personen met een achtergrond in machine learning die de machine learning-modellen willen optimaliseren die worden gebruikt voor het detecteren van complexe patronen in big data.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en evalueer verschillende open source AutoML tools (H2O AutoML, auto-sklearn, TPOT, TensorFlow, PyTorch, Auto-Keras, TPOT, Auto-WEKA, enz.)
- Train machine learning-modellen van hoge kwaliteit.
- Los verschillende soorten gesuperviseerde machine learning-problemen efficiënt op.
- Schrijf alleen de benodigde code om het geautomatiseerde machine learning-proces te starten.
Creating Custom Chatbots with Google AutoML
14 UrenDeze door een instructeur geleide, live training in België (online of op locatie) is bedoeld voor deelnemers met verschillende expertiseniveaus die gebruik willen maken van het AutoML-platform van Google om op maat gemaakte chatbots te bouwen voor verschillende toepassingen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Begrijp de basisprincipes van de ontwikkeling van chatbots.
- Navigeer door het Google Cloud Platform en ga naar AutoML.
- Bereid gegevens voor op het trainen van chatbotmodellen.
- Train en evalueer aangepaste chatbotmodellen met behulp van AutoML.
- Implementeer en integreer chatbots in verschillende platforms en kanalen.
- Bewaak en optimaliseer de prestaties van chatbots in de loop van de tijd.
DataRobot
7 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en data-analisten die voorspellende modellen willen automatiseren, evalueren en beheren met behulp van de machine learning-mogelijkheden van DataRobot.
Aan het einde van deze training zijn de deelnemers in staat om:
- Laad datasets in DataRobot om gegevens te analyseren, te beoordelen en de kwaliteit te controleren.
- Bouw en train modellen om belangrijke variabelen te identificeren en voorspellingsdoelen te halen.
- Interpreteer modellen om waardevolle inzichten te creëren die nuttig zijn bij het nemen van zakelijke beslissingen.
- Bewaak en beheer modellen om geoptimaliseerde voorspellingsprestaties te behouden.
Data Mining with Weka
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor beginnende tot gemiddelde data-analisten en datawetenschappers die Weka willen gebruiken om dataminingtaken uit te voeren.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Weka.
- Begrijp de Weka omgeving en werkbank.
- Voer dataminingtaken uit met behulp van Weka.
Google Cloud AutoML
7 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers, data-analisten en ontwikkelaars die AutoML producten en functies willen verkennen om met minimale inspanning aangepaste ML-trainingsmodellen te maken en te implementeren.
Aan het einde van deze training zijn de deelnemers in staat om:
- Verken de productlijn AutoML om verschillende services voor verschillende gegevenstypen te implementeren.
- Bereid gegevenssets voor en label ze om aangepaste ML-modellen te maken.
- Train en beheer modellen om nauwkeurige en eerlijke machine learning-modellen te produceren.
- Maak voorspellingen met behulp van getrainde modellen om te voldoen aan bedrijfsdoelstellingen en -behoeften.
Kaggle
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die willen leren en hun carrière willen opbouwen in Data Science met behulp van Kaggle.
Aan het einde van deze training zijn de deelnemers in staat om:
- Meer informatie over datawetenschap en machine learning.
- Verken data-analyse.
- Lees meer over Kaggle en hoe het werkt.
Machine Learning for Mobile Apps using Google’s ML Kit
14 UrenDeze live training onder leiding van een instructeur (online of ter plaatse) is bedoeld voor ontwikkelaars die Google's ML Kit willen gebruiken om machine learning-modellen te bouwen die zijn geoptimaliseerd voor verwerking op mobiele apparaten.
Aan het einde van deze training zijn de deelnemers in staat om:
- Stel de benodigde ontwikkelomgeving in om te beginnen met het ontwikkelen van machine learning-functies voor mobiele apps.
- Integreer nieuwe machine learning-technologieën in Android en iOS apps met behulp van de ML Kit API's.
- Verbeter en optimaliseer bestaande apps met behulp van de ML Kit SDK voor verwerking en implementatie op het apparaat.
Accelerating Python Pandas Workflows with Modin
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die Modin willen gebruiken om parallelle berekeningen te bouwen en te implementeren met Pandas voor snellere data-analyse.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet de benodigde omgeving op om te beginnen met het ontwikkelen van Pandas workflows op schaal met Modin.
- Begrijp de functies, architectuur en voordelen van Modin.
- Ken de verschillen tussen Modin, Dask en Ray.
- Voer Pandas bewerkingen sneller uit met Modin.
- Implementeer de volledige Pandas API en functies.
Machine Learning with Random Forest
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en software-engineers die Random Forest willen gebruiken om machine learning-algoritmen voor grote datasets te bouwen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Stel de benodigde ontwikkelomgeving in om te beginnen met het bouwen van machine learning-modellen met Random forest.
- Begrijp de voordelen van Random Forest en hoe u het kunt implementeren om classificatie- en regressieproblemen op te lossen.
- Leer omgaan met grote datasets en het interpreteren van meerdere beslisbomen in Random Forest.
- Evalueer en optimaliseer de prestaties van machine learning-modellen door de hyperparameters af te stemmen.
Advanced Analytics with RapidMiner
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor data-analisten op gemiddeld niveau die willen leren hoe ze RapidMiner kunnen gebruiken om waarden te schatten en te projecteren en analytische tools willen gebruiken voor het voorspellen van tijdreeksen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Leer de CRISP-DM-methodologie toe te passen, selecteer de juiste machine learning-algoritmen en verbeter de modelconstructie en -prestaties.
- Gebruik RapidMiner om waarden te schatten en te projecteren, en gebruik analytische hulpmiddelen voor het voorspellen van tijdreeksen.
RapidMiner for Machine Learning and Predictive Analytics
14 UrenRapidMiner is een open source datawetenschapssoftwareplatform voor snelle prototyping en ontwikkeling van applicaties. Het omvat een geïntegreerde omgeving voor gegevensvoorbereiding, machine learning, deep learning, text mining en voorspellende analyses.
In deze live training onder leiding van een instructeur leren deelnemers hoe ze RapidMiner Studio kunnen gebruiken voor gegevensvoorbereiding, machine learning en implementatie van voorspellende modellen.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeren en configureren RapidMiner
- Gegevens voorbereiden en visualiseren met RapidMiner
- Machine learning-modellen valideren
- Mashup data en creëer voorspellende modellen
- Operationaliseren van predictive analytics binnen een bedrijfsproces
- Problemen oplossen en optimaliseren RapidMiner
Audiëntie
- Datawetenschappers
- Ingenieurs
- Ontwikkelaars
Vorm van de cursus
- Deels lezing, deels discussie, oefeningen en zware hands-on oefening
Notitie
- Om een training op maat voor deze cursus aan te vragen, neem dan contact met ons op om een afspraak te maken.
GPU Data Science with NVIDIA RAPIDS
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die RAPIDS willen gebruiken om GPU-versnelde datapijplijnen, workflows en visualisaties te bouwen, waarbij machine learning-algoritmen worden toegepast, zoals XGBoost, cuML, enz.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet de benodigde ontwikkelomgeving op om datamodellen te bouwen met NVIDIA RAPIDS.
- Begrijp de kenmerken, componenten en voordelen van RAPIDS.
- Maak gebruik van GPUs om end-to-end data- en analysepijplijnen te versnellen.
- Implementeer GPU-versnelde gegevensvoorbereiding en ETL met cuDF en Apache Arrow.
- Leer hoe u machine learning-taken uitvoert met XGBoost- en cuML-algoritmen.
- Bouw datavisualisaties en voer grafiekanalyses uit met cuXfilter en cuGraph.