Jupyter for Data Science Teams Training Cursus
Jupyter is een open-source, webgebaseerde interactieve IDE- en computeromgeving.
Deze live training onder leiding van een instructeur (online of op locatie) introduceert het idee van gezamenlijke ontwikkeling in datawetenschap en laat zien hoe Jupyter kan worden gebruikt om als team deel te nemen aan de "levenscyclus van een computationeel idee". Het leidt deelnemers door het maken van een voorbeeldproject voor datawetenschap op basis van het Jupyter-ecosysteem.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Jupyter, inclusief het maken en integreren van een teamrepository op Git.
- Gebruik Jupyter-functies zoals extensies, interactieve widgets, modus voor meerdere gebruikers en meer om projectsamenwerking mogelijk te maken.
- Maak, deel en organiseer Jupyter Notebooks met teamleden.
- Kies uit Scala, Python, R, om code te schrijven en uit te voeren tegen big data-systemen zoals Apache Spark, allemaal via de Jupyter-interface.
Formaat van de cursus
- Interactieve lezing en discussie.
- Veel oefeningen en oefeningen.
- Hands-on implementatie in een live-lab omgeving.
Opties voor het aanpassen van cursussen
- De Jupyter Notebook ondersteunt meer dan 40 talen, waaronder R, Python, Scala, Julia, enz. Om deze cursus aan te passen aan uw taal of talen naar keuze, neem dan contact met ons op om dit te regelen.
Cursusaanbod
Inleiding tot Jupyter
- Overzicht van Jupyter en zijn ecosysteem
- Installatie en configuratie
- Jupyter configureren voor teamsamenwerking
Samenwerkingsfuncties
- Git gebruiken voor versiebeheer
- Extensies en interactieve widgets
- Modus voor meerdere gebruikers
Notitieblokken maken en beheren
- Notebook structuur en functionaliteit
- Notitieblokken delen en ordenen
- Praktische tips voor samenwerking
Programming met Jupyter
- Programmeertalen kiezen en gebruiken (Python, R, Scala)
- Code schrijven en uitvoeren
- Integratie met big data-systemen (Apache Spark)
Geavanceerde Jupyter-functies
- Jupyter-omgeving aanpassen
- Workflows automatiseren met Jupyter
- Geavanceerde gebruiksscenario's verkennen
Praktische sessies
- Hands-on laboratoria
- Data science-projecten in de echte wereld
- Groepsoefeningen en intercollegiale reviews
Samenvatting en volgende stappen
Vereisten
- Programming ervaring in talen zoals Python, R, Scala, enz.
- Een achtergrond in data science
Audiëntie
- Data science-teams
Voor open trainingen is een minimum aantal van 5 deelnemers vereist
Jupyter for Data Science Teams Training Cursus - Booking
Jupyter for Data Science Teams Training Cursus - Enquiry
Jupyter for Data Science Teams - Consultancyaanvraag
Consultancyaanvraag
Testimonials (1)
It is great to have the course custom made to the key areas that I have highlighted in the pre-course questionnaire. This really helps to address the questions that I have with the subject matter and to align with my learning goals.
Winnie Chan - Statistics Canada
Cursus - Jupyter for Data Science Teams
Voorlopige Aankomende Cursussen
Gerelateerde cursussen
Introduction to Data Science and AI using Python
35 UrenDit is een 5-daagse inleiding tot Data Science en AI.
De cursus wordt geleverd met voorbeelden en oefeningen met Python
Apache Airflow for Data Science: Automating Machine Learning Pipelines
21 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor deelnemers van gemiddeld niveau die machine learning-workflows willen automatiseren en beheren, inclusief modeltraining, validatie en implementatie met behulp van Apache Airflow.
Aan het einde van deze training zijn de deelnemers in staat om:
- Stel Apache Airflow in voor machine learning-werkstroomorkestratie.
- Automatiseer gegevensverwerking, modeltraining en validatietaken.
- Integreer Airflow met machine learning-frameworks en -tools.
- Implementeer machine learning-modellen met behulp van geautomatiseerde pijplijnen.
- Bewaak en optimaliseer machine learning-workflows in productie.
Anaconda Ecosystem for Data Scientists
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers die het Anaconda-ecosysteem willen gebruiken om pakketten en workflows voor gegevensanalyse vast te leggen, te beheren en te implementeren in één enkel platform.
Aan het einde van deze training zijn de deelnemers in staat om:
- Installeer en configureer Anaconda componenten en bibliotheken.
- Begrijp de kernconcepten, kenmerken en voordelen van Anaconda.
- Beheer pakketten, omgevingen en kanalen met behulp van Anaconda Navigator.
- Gebruik Conda-, R- en Python-pakketten voor datawetenschap en machine learning.
- Maak kennis met enkele praktische use cases en technieken voor het beheren van meerdere data-omgevingen.
AWS Cloud9 for Data Science
28 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en analisten van gemiddeld niveau die AWS Cloud9 willen gebruiken voor gestroomlijnde data science-workflows.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet een data science omgeving op in AWS Cloud9.
- Voer gegevensanalyse uit met behulp van Python, R en Jupyter Notebook in Cloud9.
- Integreer AWS Cloud9 met AWS-dataservices zoals S3, RDS en Redshift.
- Gebruik AWS Cloud9 voor de ontwikkeling en implementatie van machine learning-modellen.
- Optimaliseer cloudgebaseerde workflows voor gegevensanalyse en -verwerking.
Big Data Business Intelligence for Telecom and Communication Service Providers
35 UrenOverzicht
Communications service providers (CSP) worden geconfronteerd met druk om kosten te verminderen en gemiddelde inkomsten per gebruiker (ARPU) te maximaliseren, terwijl een uitstekende klantervaring wordt gewaarborgd, maar gegevensvolumes blijven groeien. Het wereldwijde mobiele gegevensverkeer zal groeien bij een gecombineerde jaarlijkse groei (CAGR) van 78 procent tegen 2016, tot 10,8 exabytes per maand.
Ondertussen genereren CSP's grote hoeveelheden gegevens, waaronder call details records (CDR), netwerkgegevens en klantgegevens. Bedrijven die deze gegevens volledig exploiteren, krijgen een concurrentievoordeel. Volgens een recente enquête van The Economist Intelligence Unit, bedrijven die gebruik maken van data-gerichte besluitvorming genieten een 5-6% boost in productiviteit. Maar 53% van de bedrijven gebruikt slechts de helft van hun waardevolle gegevens, en een kwart van de respondenten merkte op dat enorme hoeveelheden nuttige gegevens niet worden vervuld. De gegevensvolumes zijn zo hoog dat handmatige analyse onmogelijk is, en de meeste erfgoedsoftware-systemen kunnen niet ophouden, wat resulteert in waardevolle gegevens die worden weggegooid of verwaarloosd.
Met Big Data & Analytics’ high-speed, scalable big data software, CSP's kunnen al hun gegevens mineren voor betere besluitvorming in minder tijd. Verschillende Big Data producten en technieken bieden een end-to-end softwareplatform voor het verzamelen, voorbereiden, analyseren en presenteren van inzichten uit grote gegevens. De toepassingsgebieden omvatten netwerkprestaties monitoring, fraude detectie, klantchurns detectie en kredietrisico-analyse. Big Data & Analytics producten schaal om terabytes van gegevens te beheren, maar de implementatie van dergelijke tools vereist een nieuwe vorm van cloud-gebaseerde database systeem zoals Hadoop of massieve schaal parallelle computing processor (KPU etc.)
Deze cursus werkt op Big Data BI voor Telco omvat alle opkomende nieuwe gebieden waarin CSP's investeren om productiviteit te vergroten en nieuwe bedrijfsinkomsten te openen. De cursus biedt een volledige 360 graden overzicht op Big Data BI in Telco zodat besluitvormers en managers een zeer brede en uitgebreide overzicht van de mogelijkheden van Big Data BI in Telco voor productiviteit en inkomen winst.
Cursus doelstellingen
Het belangrijkste doel van de cursus is om nieuwe Big Data business intelligence technieken te introduceren in 4 sectoren van Telecom Business (Marketing/Sales, Network Operation, Financial Operation en Customer Relation Management). Studenten worden geïntroduceerd om te volgen:
- Introductie tot Big Data-wat is 4Vs (volume, snelheid, variëteit en waarheid) in Big Data- Generatie, extractie en beheer vanuit Telco perspectief
- Hoe Big Data analytic verschilt van legacy data analytic
- In-house rechtvaardiging van Big Data -Telco perspectief
- Introductie tot Hadoop Ecosystem- bekendheid met alle Hadoop tools zoals Hive, Pig, SPARC – wanneer en hoe ze worden gebruikt om het probleem op te lossen Big Data
- Hoe Big Data wordt verkregen om te analyseren voor analyse tool-hoe Business Analysis’s kunnen hun pijnpunten van het verzamelen en analyseren van gegevens door middel van geïntegreerde Hadoop dashboard benadering te verminderen
- Basiskennis van Insight-analyse, visualisatie-analyse en predictieve analyse voor Telco
- Customer Churn-analyse en Big Data-how Big Data-analyse kunnen klantchurn en klantongeluk verminderen in Telco-case studies
- Analyse van netwerkfalen en servicefalen van netwerkmetadata en IPDR
- Financiële analyse-fraude, wastage en ROI-schatting uit verkoop- en operationele gegevens
- Customer acquisition problem-Target marketing, klantsegmentatie en cross-sales van verkoopgegevens
- Introductie en samenvatting van alle Big Data analytische producten en waar ze passen in de analytische ruimte van Telco
- Conclusie - hoe stap voor stap een benadering te nemen om Big Data Business Intelligence in uw organisatie te introduceren
Gericht publiek
- Netwerkbeheer, Financieel Manager, CRM-managers en top IT-managers in Telco CIO-kantoor.
- Business Analisten in Telco
- CFO kantoormanagers / analisten
- Operatieve managers
- QA Managers
Introduction to Google Colab for Data Science
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en IT-professionals op beginnersniveau die de basis van datawetenschap willen leren met behulp van Google Colab.
Aan het einde van deze training zijn de deelnemers in staat om:
- Stel in en navigeer naar Google Colab.
- Schrijven en uitvoeren van basis Python code.
- Gegevenssets importeren en verwerken.
- Maak visualisaties met behulp van Python bibliotheken.
A Practical Introduction to Data Science
35 UrenDeelnemers die deze training voltooien, krijgen een praktisch, realistisch inzicht in Data Science en de bijbehorende technologieën, methodologieën en hulpmiddelen.
Deelnemers krijgen de kans om deze kennis in de praktijk te brengen door middel van praktische oefeningen. Groepsinteractie en feedback van de instructeur vormen een belangrijk onderdeel van de klas.
De cursus begint met een inleiding tot de elementaire concepten van Data Science en gaat vervolgens verder met de hulpmiddelen en methodologieën die in Data Science worden gebruikt.
Audiëntie
- Ontwikkelaars
- Technische analisten
- IT-adviseurs
Vorm van de cursus
- Deels lezing, deels discussie, oefeningen en zware hands-on oefening
Notitie
- Om een training op maat voor deze cursus aan te vragen, neem dan contact met ons op om een afspraak te maken.
Data Science Programme
245 UrenDe explosie van informatie en data in de wereld van vandaag is ongeëvenaard; ons vermogen om te innoveren en de grenzen van het mogelijke te verleggen groeit sneller dan ooit tevoren. De rol van Data Scientist is tegenwoordig een van de meest gevraagde vaardigheden in de industrie.
Wij bieden veel meer dan leren via theorie; wij leveren praktische, verkoopbare vaardigheden die de kloof overbruggen tussen de wereld van de academische wereld en de eisen van de industrie.
Dit curriculum van 7 weken kan worden afgestemd op uw specifieke branchevereisten. Neem contact met ons op voor meer informatie of bezoek de website van het Nobleprog Instituut
Publiek:
Dit programma is bedoeld voor afgestudeerden op postniveau en voor iedereen met de vereiste vereiste vaardigheden, die zullen worden bepaald door een beoordeling en een interview.
Levering:
De cursus wordt gegeven een mix van Instructor Led Classroom en Instructor Led Online; normaal gesproken zal de eerste week 'klassikaal geleid' zijn, weken 2 - 6 'virtueel klaslokaal' en week 7 terug naar 'klassikaal geleid'.
Data Science for Big Data Analytics
35 UrenBig data zijn datasets die zo omvangrijk en complex zijn dat traditionele applicatiesoftware voor gegevensverwerking onvoldoende is om hiermee om te gaan. Big data-uitdagingen zijn onder meer het vastleggen van gegevens, gegevensopslag, gegevensanalyse, zoeken, delen, overdragen, visualiseren, opvragen, bijwerken en informatieprivacy.
Data Science essential for Marketing/Sales professionals
21 UrenDeze cursus is bedoeld voor Marketing Sales Professionals die dieper willen ingaan op de toepassing van data science in Marketing/ Sales. De cursus biedt gedetailleerde dekking van verschillende data science-technieken die worden gebruikt voor ‘upsale’, ‘cross-sale’, marktsegmentatie, branding en CLV.
Verschil tussen Marketing en verkoop - Hoe is het dat verkoop en marketing verschillend zijn?
In heel eenvoudige bewoordingen kan verkoop worden omschreven als een proces dat zich richt op of zich richt op individuen of kleine groepen. Marketing richt zich daarentegen op een grotere groep of het algemene publiek. Marketing omvat onderzoek (het identificeren van de behoeften van de klant), de ontwikkeling van producten (het produceren van innovatieve producten) en het promoten van het product (via advertenties) en het creëren van bewustzijn over het product bij de consument. Marketing betekent dus het genereren van leads of prospects. Zodra het product op de markt is, is het de taak van de verkoper om de klant ervan te overtuigen het product te kopen. Sales betekent het omzetten van de leads of prospects in aankopen en bestellingen, terwijl marketing gericht is op langere termijnen, heeft sales betrekking op kortere doelen.
Introduction to Data Science
35 UrenDeze instructeur-geleide, live training (ter plaatse of op afstand) is gericht op professionals die een carrière in Data Science willen beginnen.
Aan het einde van deze training kunnen deelnemers:
- Installeer en configureer Python en MySql.
- Begrijp wat Data Science is en hoe het waarde kan toevoegen aan vrijwel elk bedrijf.
- Leer de basisprincipes van codering in Python
- Leer technieken onder toezicht en zonder toezicht Machine Learning , en hoe deze te implementeren en de resultaten te interpreteren.
Indeling van de cursus
- Interactieve lezing en discussie.
- Veel oefeningen en oefenen.
- Praktische implementatie in een live-labomgeving.
Cursusaanpassingsopties
- Neem contact met ons op om een aangepaste training voor deze cursus aan te vragen.
Kaggle
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die willen leren en hun carrière willen opbouwen in Data Science met behulp van Kaggle.
Aan het einde van deze training zijn de deelnemers in staat om:
- Meer informatie over datawetenschap en machine learning.
- Verken data-analyse.
- Lees meer over Kaggle en hoe het werkt.
Data Science with KNIME Analytics Platform
21 UrenKNIME Analytics Platform is een toonaangevende open source-optie voor data-driven innovatie, waarmee u het potentieel in uw gegevens verborgen kunt ontdekken, nieuwe inzichten kunt verkrijgen of nieuwe toekomst kunt voorspellen. Met meer dan 1000 modules, honderden voorbereide voorbeelden, een uitgebreid assortiment geïntegreerde tools en de breedste keuze van geavanceerde algoritmen beschikbaar, KNIME Analytics Platform is de perfecte toolbox voor elke data wetenschapper en business analist.
Deze cursus voor KNIME Analytics Platform is een ideale gelegenheid voor beginners, geavanceerde gebruikers en KNIME experts om te worden geïntroduceerd aan KNIME, om te leren hoe het effectiever te gebruiken, en hoe om duidelijke, uitgebreide rapporten te creëren op basis van KNIME werkstromen
Deze instructeur geleide, live training (online of on-site) is gericht op gegevens professionals die willen gebruiken KNIME om complexe zakelijke behoeften op te lossen.
Het is gericht op het publiek dat geen programmering kent en van plan is om geavanceerde tools te gebruiken om analytische scenario's te implementeren.
Aan het einde van deze training zullen de deelnemers in staat zijn:
- Installeer en configureren KNIME.
- Maak Data Science scenario’s
- Train, testen en valideren van modellen
- Implementatie eindigt met de eindwaardeketen van gegevenswetenschapsmodellen
Format van de cursus
- Interactieve lezingen en discussie.
- Veel oefeningen en oefeningen.
- Hand-on implementatie in een live-lab-omgeving.
Cursus aanpassingsopties
- Om een aangepaste training voor deze cursus te vragen of om meer te weten te komen over dit programma, neem dan contact met ons op om te organiseren.
Accelerating Python Pandas Workflows with Modin
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die Modin willen gebruiken om parallelle berekeningen te bouwen en te implementeren met Pandas voor snellere data-analyse.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet de benodigde omgeving op om te beginnen met het ontwikkelen van Pandas workflows op schaal met Modin.
- Begrijp de functies, architectuur en voordelen van Modin.
- Ken de verschillen tussen Modin, Dask en Ray.
- Voer Pandas bewerkingen sneller uit met Modin.
- Implementeer de volledige Pandas API en functies.
GPU Data Science with NVIDIA RAPIDS
14 UrenDeze live training onder leiding van een instructeur in België (online of ter plaatse) is bedoeld voor datawetenschappers en -ontwikkelaars die RAPIDS willen gebruiken om GPU-versnelde datapijplijnen, workflows en visualisaties te bouwen, waarbij machine learning-algoritmen worden toegepast, zoals XGBoost, cuML, enz.
Aan het einde van deze training zijn de deelnemers in staat om:
- Zet de benodigde ontwikkelomgeving op om datamodellen te bouwen met NVIDIA RAPIDS.
- Begrijp de kenmerken, componenten en voordelen van RAPIDS.
- Maak gebruik van GPUs om end-to-end data- en analysepijplijnen te versnellen.
- Implementeer GPU-versnelde gegevensvoorbereiding en ETL met cuDF en Apache Arrow.
- Leer hoe u machine learning-taken uitvoert met XGBoost- en cuML-algoritmen.
- Bouw datavisualisaties en voer grafiekanalyses uit met cuXfilter en cuGraph.